AI BENCHY زمرہ ناکامیاں
کوڈنگ: ٹائم آؤٹ
کوڈنگ
ٹائم آؤٹ
دیکھیں کہ کوڈنگ میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | ٹائم آؤٹ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #25 | DeepSeek V3.2 medium | DeepSeek | 1 | 4.7 | 0/1 | 180.9s |
| #43 | Kimi K2.5 medium | Moonshot AI | 1 | 4.7 | 0/1 | 150.8s |
| #22 | Gemma 4 26B A4B medium | 1 | 2.8 | 0/1 | 147.5s | |
| #31 | GLM 5.1 medium | Z.ai | 1 | 4.7 | 0/1 | 118.5s |
| #17 | Qwen3.5-122B-A10B medium | Qwen | 1 | 4.7 | 0/1 | 71.0s |
| #12 | Gemma 4 31B medium | 1 | 4.7 | 0/1 | 71.0s | |
| #30 | Qwen3.5-Flash medium | Qwen | 1 | 4.7 | 0/1 | 45.7s |
| #87 | GLM 4.7 Flash medium | Z.ai | 1 | 3.6 | 0/1 | 21.3s |
| #38 | MiMo-V2-Flash medium | Xiaomi | 1 | 4.7 | 0/1 | 13.0s |
| #57 | Gemma 4 26B A4B none | 1 | 4.7 | 0/1 | 7.07s | |
| #86 | Qwen3 Coder Next medium | Qwen | 1 | 4.7 | 0/1 | 1.69s |
| #67 | MiniMax M2.5 medium | Minimax | 1 | 3.0 | 0/1 | 0ms |