AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY विफलताएँ

कोई उत्तर नहीं विफलताएँ

देखें कि किन AI मॉडलों में कोई उत्तर नहीं सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

6

कुल विफलताएँ

7

सबसे अधिक प्रभावित मॉडल

Kimi K2.5 1
रैंक मॉडल कंपनी कोई उत्तर नहीं संख्या औसत स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम औसत स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल