AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY विफलताएँ

API त्रुटि विफलताएँ

देखें कि किन AI मॉडलों में API त्रुटि सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

15

कुल विफलताएँ

144

सबसे अधिक प्रभावित मॉडल

Qwen3.5-9B 1
रैंक मॉडल कंपनी API त्रुटि संख्या स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#105 Nemotron 3 Super medium NVIDIA 3 5.8 8/21 32.0s
#26 Qwen3.6 Plus medium Qwen 1 7.9 14/21 30.7s
#100 Grok Build 0.1 none X AI 3 6.0 7/19 28.7s
#43 MiMo-V2.5-Pro medium Xiaomi 1 7.5 12/21 26.1s
#89 Hy3 preview low Tencent 7 6.4 10/21 24.6s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#126 gpt-oss-120b none OpenAI 3 5.4 6/19 21.6s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#46 Qwen3.6 35B A3B medium Qwen 2 7.4 13/21 18.1s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 6 4.6 4/19 17.1s
#33 Hy3 preview medium Tencent 3 7.7 14/21 16.3s
#93 Qwen3.6 Plus Preview medium Qwen 8 6.3 9/19 15.2s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 1 7.5 13/21 15.1s
#92 Laguna M.1 medium Poolside 4 6.4 9/19 14.7s
#133 DeepSeek V3.2 none DeepSeek 4 5.2 6/21 13.8s

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल