AI BENCHY زمرہ ناکامیاں
ڈومین مخصوص: ٹائم آؤٹ
ڈومین مخصوص
ٹائم آؤٹ
دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #33 | GLM 5.1 medium | Z.ai | 1 | 5.3 | 1/3 | 29.8s |
| #40 | GPT-5.2 medium | OpenAI | 1 | 5.9 | 1/3 | 77.8s |
| #45 | GPT-5 Mini medium | OpenAI | 1 | 3.6 | 0/3 | 44.6s |
| #46 | Kimi K2.5 medium | Moonshot AI | 1 | 3.5 | 0/3 | 137.3s |
| #50 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/3 | 10.5s |
| #51 | Nemotron 3 Super medium | NVIDIA | 1 | 2.9 | 0/3 | 16.2s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 5.8 | 1/3 | 121.8s |
| #57 | GPT-5 Nano medium | OpenAI | 1 | 5.2 | 1/3 | 204.0s |
| #71 | MiniMax M2.5 medium | Minimax | 1 | 2.9 | 0/3 | 237.3s |