AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY विफलताएँ

समय समाप्त विफलताएँ

देखें कि किन AI मॉडलों में समय समाप्त सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: औसत स्कोर ↑.

दिखाए गए मॉडल

15

कुल विफलताएँ

25

सबसे अधिक प्रभावित मॉडल

MiniMax M2.5 2
रैंक मॉडल कंपनी समय समाप्त संख्या औसत स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#43 MiniMax M2.5 medium Minimax 2 4.7 5/16 43.0s
#34 GPT-5 Nano medium OpenAI 1 5.5 7/16 47.9s
#35 Qwen3.5-35B-A3B medium Qwen 4 5.5 8/16 43.9s
#32 GPT-5 Mini medium OpenAI 1 6.0 8/16 25.1s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s
#23 Seed-2.0-Mini medium Bytedance Seed 4 6.9 10/16 65.1s
#24 Qwen3.5-Flash medium Qwen 3 6.9 10/16 70.8s
#18 DeepSeek V3.2 medium DeepSeek 1 7.3 11/16 39.5s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#10 Qwen3.5-122B-A10B medium Qwen 1 7.7 12/16 29.7s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.7 12/16 11.2s
#7 Qwen3.5-27B medium Qwen 1 8.2 12/16 52.1s
#4 Qwen3.5 Plus 2026-02-15 medium Qwen 2 8.3 13/16 34.5s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम औसत स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल