AI BENCHY ناکامیاں
ٹائم آؤٹ ناکامیاں
دیکھیں کہ کن AI ماڈلز میں ٹائم آؤٹ سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #94 | GPT-5 Nano medium | OpenAI | 1 | 6.3 | 9/21 | 42.5s |
| #29 | Qwen3.5-122B-A10B medium | Qwen | 2 | 7.8 | 14/21 | 42.5s |
| #18 | Qwen3.7 Plus medium | Qwen | 1 | 8.2 | 15/21 | 38.9s |
| #130 | MiniMax M2.7 medium | Minimax | 2 | 5.3 | 5/21 | 38.2s |
| #158 | GLM 4.7 Flash medium | Z.ai | 2 | 4.4 | 4/21 | 35.1s |
| #55 | GLM 5.1 medium | Z.ai | 2 | 7.3 | 12/21 | 33.7s |
| #17 | GLM 5 medium | Z.ai | 1 | 8.3 | 15/21 | 33.5s |
| #105 | Nemotron 3 Super medium | NVIDIA | 1 | 5.8 | 8/21 | 32.0s |
| #86 | Grok 4.1 Fast medium | X AI | 1 | 6.5 | 9/19 | 23.8s |
| #54 | GPT-5 Mini medium | OpenAI | 1 | 7.3 | 12/21 | 23.6s |
| #23 | GLM 5 Turbo medium | Z.ai | 1 | 8.0 | 14/21 | 23.0s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 7.4 | 12/21 | 22.2s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 1 | 7.2 | 12/21 | 20.1s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 1 | 7.4 | 13/21 | 17.1s |
| #42 | GPT-5.2 medium | OpenAI | 1 | 7.5 | 13/21 | 16.9s |