AI BENCHY زمرہ ناکامیاں
کوڈنگ: کوئی جواب نہیں
کوڈنگ
کوئی جواب نہیں
دیکھیں کہ کوڈنگ میں کن AI ماڈلز کو کوئی جواب نہیں پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | کوئی جواب نہیں کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #47 | Gemma 4 26B A4B medium | 1 | 2.9 | 0/2 | 258.4s | |
| #70 | Qwen3.5-35B-A3B medium | Qwen | 1 | 6.5 | 1/2 | 244.5s |
| #79 | Kimi K2.5 medium | Moonshot AI | 1 | 4.1 | 0/2 | 215.9s |
| #72 | MiMo-V2-Omni medium | Xiaomi | 1 | 3.4 | 0/2 | 183.9s |
| #83 | Qwen3.6 27B medium | Qwen | 1 | 6.6 | 1/2 | 165.4s |
| #51 | GLM 5.1 medium | Z.ai | 1 | 4.7 | 0/2 | 145.6s |
| #151 | Qwen3.5-9B medium | Qwen | 1 | 2.8 | 0/2 | 135.6s |
| #54 | Kimi K2.6 medium | Moonshot AI | 1 | 6.5 | 1/2 | 118.2s |
| #23 | Gemma 4 31B medium | 1 | 3.8 | 0/2 | 110.9s | |
| #58 | Step 3.5 Flash medium | Stepfun | 1 | 3.0 | 0/1 | 62.8s |
| #30 | Qwen3.6 35B A3B medium | Qwen | 1 | 6.6 | 1/2 | 59.3s |
| #148 | GLM 4.7 Flash medium | Z.ai | 1 | 3.4 | 0/2 | 55.3s |
| #133 | MiniMax M2.7 medium | Minimax | 1 | 6.7 | 1/2 | 54.7s |
| #28 | GLM 5 Turbo medium | Z.ai | 1 | 7.3 | 1/2 | 53.9s |
| #80 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.8 | 0/2 | 51.8s |