AI BENCHY
Your ad here

AI BENCHY विफलताएँ

समय समाप्त विफलताएँ

देखें कि किन AI मॉडलों में समय समाप्त सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: विफलता संख्या ↑.

दिखाए गए मॉडल

15

कुल विफलताएँ

61

सबसे अधिक प्रभावित मॉडल

Claude Opus 4.7 1
रैंक मॉडल कंपनी समय समाप्त संख्या स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#93 GLM 4.7 Flash medium Z.ai 1 4.6 4/18 32.3s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 2 8.5 14/18 46.6s
#19 Qwen3.5-122B-A10B medium Qwen 2 8.1 13/18 31.4s
#24 Gemma 4 26B A4B medium Google 2 8.0 13/18 25.0s
#27 DeepSeek V3.2 medium DeepSeek 2 8.0 12/18 46.4s
#33 GLM 5.1 medium Z.ai 2 7.8 12/18 24.1s
#34 Kimi K2.6 medium Moonshot AI 2 7.7 11/18 45.2s
#46 Kimi K2.5 medium Moonshot AI 2 7.0 9/18 72.4s
#50 Hunter Alpha medium OpenRouter 2 6.7 8/18 10.3s
#80 MiniMax M2.7 medium Minimax 2 5.3 4/18 31.1s
#32 Qwen3.5-Flash medium Qwen 4 7.8 11/18 66.7s
#39 Seed-2.0-Mini medium Bytedance Seed 4 7.5 11/18 69.7s
#43 Qwen3.5-35B-A3B medium Qwen 4 7.4 10/18 44.5s
#71 MiniMax M2.5 medium Minimax 4 5.7 5/18 39.6s
#97 Qwen3.5-9B medium Qwen 11 4.4 3/18 73.6s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल