AI BENCHY
Advertise here

AI BENCHY विफलताएँ

समय समाप्त विफलताएँ

देखें कि किन AI मॉडलों में समय समाप्त सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: स्कोर ↓.

दिखाए गए मॉडल

15

कुल विफलताएँ

73

सबसे अधिक प्रभावित मॉडल

Claude Opus 4.7 1
रैंक मॉडल कंपनी समय समाप्त संख्या स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#11 Claude Opus 4.7 medium Anthropic 1 8.7 17/21 4.73s
#17 GLM 5 medium Z.ai 1 8.3 15/21 33.5s
#18 Qwen3.7 Plus medium Qwen 1 8.2 15/21 38.9s
#23 GLM 5 Turbo medium Z.ai 1 8.0 14/21 23.0s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 2 7.9 14/21 73.8s
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#29 Qwen3.5-122B-A10B medium Qwen 2 7.8 14/21 42.5s
#30 Qwen3.5-27B medium Qwen 1 7.8 13/21 68.4s
#37 Gemma 4 26B A4B medium Google 2 7.6 14/21 63.4s
#42 GPT-5.2 medium OpenAI 1 7.5 13/21 16.9s
#49 Qwen3.5-Flash medium Qwen 3 7.4 12/21 63.3s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#52 Claude Sonnet 4.6 medium Anthropic 1 7.4 13/21 17.1s
#54 GPT-5 Mini medium OpenAI 1 7.3 12/21 23.6s
#55 GLM 5.1 medium Z.ai 2 7.3 12/21 33.7s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल