AI BENCHY زمرہ ناکامیاں
کوڈنگ: اضافی فارمیٹنگ
کوڈنگ
اضافی فارمیٹنگ
دیکھیں کہ کوڈنگ میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #31 | Grok 4.3 medium | X AI | 1 | 7.4 | 1/2 | 55.3s |
| #40 | MiMo-V2.5-Pro medium | Xiaomi | 1 | 7.0 | 1/2 | 81.7s |
| #45 | Grok Build 0.1 medium | X AI | 1 | 5.3 | 0/2 | 67.4s |
| #46 | Claude Sonnet 4.6 medium | Anthropic | 1 | 6.9 | 1/2 | 33.9s |
| #69 | Claude Sonnet 4.6 none | Anthropic | 1 | 6.8 | 1/2 | 6.73s |
| #93 | MiMo-V2-Omni none | Xiaomi | 1 | 5.1 | 0/2 | 2.75s |
| #106 | Owl Alpha none | Openrouter | 1 | 7.0 | 1/2 | 39.7s |