AI BENCHY विफलताएँ
API त्रुटि विफलताएँ
देखें कि किन AI मॉडलों में API त्रुटि सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: विफलता संख्या ↑.
| रैंक | मॉडल | कंपनी | API त्रुटि संख्या | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 7.9 | 14/21 | 73.8s |
| #26 | Qwen3.6 Plus medium | Qwen | 1 | 7.9 | 14/21 | 30.7s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 1 | 7.5 | 13/21 | 15.1s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 1 | 7.5 | 12/21 | 26.1s |
| #49 | Qwen3.5-Flash medium | Qwen | 1 | 7.4 | 12/21 | 63.3s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 7.4 | 12/21 | 22.2s |
| #55 | GLM 5.1 medium | Z.ai | 1 | 7.3 | 12/21 | 33.7s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 1 | 7.2 | 12/21 | 20.1s |
| #66 | Qwen3.5-35B-A3B medium | Qwen | 1 | 7.1 | 11/21 | 72.6s |
| #79 | Hunter Alpha medium | OpenRouter | 1 | 6.7 | 8/18 | 10.3s |
| #80 | Mimo V2 Omni medium | Xiaomi | 1 | 6.7 | 10/21 | 41.2s |
| #101 | Mimo V2 Omni none | Xiaomi | 1 | 6.0 | 8/21 | 2.44s |
| #111 | Owl Alpha medium | Openrouter | 1 | 5.7 | 8/21 | 11.9s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 5.7 | 7/21 | 12.4s |
| #116 | Hunter Alpha none | OpenRouter | 1 | 5.7 | 6/18 | 4.70s |