AI BENCHY
Your ad here

AI BENCHY विफलताएँ

समय समाप्त विफलताएँ

देखें कि किन AI मॉडलों में समय समाप्त सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: विफलता संख्या ↑.

दिखाए गए मॉडल

15

कुल विफलताएँ

61

सबसे अधिक प्रभावित मॉडल

Claude Opus 4.7 1
रैंक मॉडल कंपनी समय समाप्त संख्या स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#3 Claude Opus 4.7 medium Anthropic 1 9.2 16/18 3.53s
#10 Qwen3.5-27B medium Qwen 1 8.4 13/18 53.0s
#13 GLM 5 medium Z.ai 1 8.4 13/18 23.3s
#14 Gemma 4 31B medium Google 1 8.3 13/18 24.9s
#18 GLM 5 Turbo medium Z.ai 1 8.1 12/18 17.7s
#23 MiMo-V2-Pro medium Xiaomi 1 8.1 12/18 12.3s
#26 Claude Sonnet 4.6 medium Anthropic 1 8.0 13/18 12.7s
#40 GPT-5.2 medium OpenAI 1 7.5 11/18 14.0s
#41 MiMo-V2-Flash medium Xiaomi 1 7.5 11/18 23.4s
#45 GPT-5 Mini medium OpenAI 1 7.0 9/18 24.0s
#51 Nemotron 3 Super medium NVIDIA 1 6.7 9/18 19.1s
#52 Grok 4.1 Fast medium X AI 1 6.7 9/18 23.9s
#57 GPT-5 Nano medium OpenAI 1 6.3 7/18 44.1s
#60 Gemma 4 26B A4B none Google 1 6.2 7/18 6.59s
#92 Qwen3 Coder Next medium Qwen 1 4.7 3/18 10.8s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल