AI BENCHY
Your ad here

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: ٹائم آؤٹ

ڈومین مخصوص
ٹائم آؤٹ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

15

کل ناکامیاں

31

سب سے زیادہ متاثر ماڈل

GLM 5 1
درجہ ماڈل کمپنی ٹائم آؤٹ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#13 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#39 Seed-2.0-Mini medium Bytedance Seed 3 3.0 0/3 0ms
#3 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#23 MiMo-V2-Pro medium Xiaomi 1 5.3 1/3 6.00s
#50 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#51 Nemotron 3 Super medium NVIDIA 1 2.9 0/3 16.2s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#80 MiniMax M2.7 medium Minimax 2 3.0 0/3 19.0s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#33 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#27 DeepSeek V3.2 medium DeepSeek 1 5.3 1/3 39.3s
#45 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#40 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s

ٹائم آؤٹ کی تعداد کے لحاظ سے سرفہرست ماڈلز

ٹائم آؤٹ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز