AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY विफलताएँ

कोई उत्तर नहीं विफलताएँ

देखें कि किन AI मॉडलों में कोई उत्तर नहीं सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

6

कुल विफलताएँ

7

सबसे अधिक प्रभावित मॉडल

GPT-5.2 1
रैंक मॉडल कंपनी कोई उत्तर नहीं संख्या औसत स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम औसत स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल