AI BENCHY زمرہ ناکامیاں
ڈومین مخصوص: ٹائم آؤٹ
ڈومین مخصوص
ٹائم آؤٹ
دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ناکامیوں کی تعداد ↑.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #3 | Claude Opus 4.7 medium | Anthropic | 1 | 7.7 | 2/3 | 1.17s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 5.3 | 1/3 | 17.5s |
| #10 | Qwen3.5-27B medium | Qwen | 1 | 5.3 | 1/3 | 79.5s |
| #13 | GLM 5 medium | Z.ai | 1 | 3.5 | 0/3 | 0ms |
| #18 | GLM 5 Turbo medium | Z.ai | 1 | 2.9 | 0/3 | 71.1s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 1 | 5.3 | 1/3 | 6.00s |
| #24 | Gemma 4 26B A4B medium | 1 | 2.9 | 0/3 | 23.6s | |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 1 | 2.9 | 0/3 | 0ms |
| #27 | DeepSeek V3.2 medium | DeepSeek | 1 | 5.3 | 1/3 | 39.3s |
| #32 | Qwen3.5-Flash medium | Qwen | 1 | 5.3 | 1/3 | 146.5s |
| #33 | GLM 5.1 medium | Z.ai | 1 | 5.3 | 1/3 | 29.8s |
| #40 | GPT-5.2 medium | OpenAI | 1 | 5.9 | 1/3 | 77.8s |
| #45 | GPT-5 Mini medium | OpenAI | 1 | 3.6 | 0/3 | 44.6s |
| #46 | Kimi K2.5 medium | Moonshot AI | 1 | 3.5 | 0/3 | 137.3s |
| #50 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/3 | 10.5s |