AI BENCHY
Your ad here

AI BENCHY श्रेणी विफलताएँ

डोमेन-विशिष्ट: समय समाप्त

डोमेन-विशिष्ट
समय समाप्त

देखें कि डोमेन-विशिष्ट में किन AI मॉडलों में समय समाप्त आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें।

दिखाए गए मॉडल

15

कुल विफलताएँ

31

सबसे अधिक प्रभावित मॉडल

Seed-2.0-Mini 3
रैंक मॉडल कंपनी समय समाप्त संख्या श्रेणी स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#39 Seed-2.0-Mini medium Bytedance Seed 3 3.0 0/3 0ms
#97 Qwen3.5-9B medium Qwen 3 3.6 0/3 137.7s
#34 Kimi K2.6 medium Moonshot AI 2 5.3 1/3 202.4s
#43 Qwen3.5-35B-A3B medium Qwen 2 4.1 0/3 88.3s
#80 MiniMax M2.7 medium Minimax 2 3.0 0/3 19.0s
#3 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#10 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#13 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#23 MiMo-V2-Pro medium Xiaomi 1 5.3 1/3 6.00s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#27 DeepSeek V3.2 medium DeepSeek 1 5.3 1/3 39.3s
#32 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s

समय समाप्त संख्या के अनुसार शीर्ष मॉडल

समय समाप्त संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल