AI BENCHY विफलताएँ
कोई उत्तर नहीं विफलताएँ
देखें कि किन AI मॉडलों में कोई उत्तर नहीं सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: विफलता संख्या ↑.
| रैंक | मॉडल | कंपनी | कोई उत्तर नहीं संख्या | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #13 | GLM 5 medium | Z.ai | 1 | 8.4 | 13/18 | 23.3s |
| #35 | MiMo-V2-Omni medium | Xiaomi | 1 | 7.7 | 11/18 | 16.8s |
| #40 | GPT-5.2 medium | OpenAI | 1 | 7.5 | 11/18 | 14.0s |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 7.4 | 10/18 | 44.5s |
| #46 | Kimi K2.5 medium | Moonshot AI | 1 | 7.0 | 9/18 | 72.4s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 6.7 | 9/18 | 23.9s |
| #93 | GLM 4.7 Flash medium | Z.ai | 2 | 4.6 | 4/18 | 32.3s |