AI BENCHY
Advertise here

AI BENCHY विफलताएँ

समय समाप्त विफलताएँ

देखें कि किन AI मॉडलों में समय समाप्त सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

15

कुल विफलताएँ

73

सबसे अधिक प्रभावित मॉडल

Qwen3.5-9B 11
रैंक मॉडल कंपनी समय समाप्त संख्या स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#73 Seed-2.0-Mini medium Bytedance Seed 5 6.9 11/21 80.2s
#62 Step 3.5 Flash medium Stepfun 1 7.2 11/20 72.5s
#49 Qwen3.5-Flash medium Qwen 3 7.4 12/21 63.3s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#54 GPT-5 Mini medium OpenAI 1 7.3 12/21 23.6s
#55 GLM 5.1 medium Z.ai 2 7.3 12/21 33.7s
#60 Kimi K2.6 medium Moonshot AI 3 7.2 12/21 71.7s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#30 Qwen3.5-27B medium Qwen 1 7.8 13/21 68.4s
#42 GPT-5.2 medium OpenAI 1 7.5 13/21 16.9s
#52 Claude Sonnet 4.6 medium Anthropic 1 7.4 13/21 17.1s
#23 GLM 5 Turbo medium Z.ai 1 8.0 14/21 23.0s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 2 7.9 14/21 73.8s
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#29 Qwen3.5-122B-A10B medium Qwen 2 7.8 14/21 42.5s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल