AI BENCHY زمرہ ناکامیاں
اینٹی اے آئی چالیں
اضافی فارمیٹنگ
اینٹی اے آئی چالیں
اضافی فارمیٹنگ
دیکھیں کہ اینٹی اے آئی چالیں میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
متعلقہ ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #25 | Claude Sonnet 4.6 none | Anthropic | 2 | 4.0 | 1/3 | 4.83s |
| #26 | Claude Opus 4.6 medium | Anthropic | 2 | 4.0 | 1/3 | 11.9s |
| #33 | DeepSeek V3.2 none | DeepSeek | 2 | 10.0 | 0/3 | 8.79s |
| #11 | Claude Sonnet 4.6 medium | Anthropic | 1 | 7.0 | 2/3 | 4.95s |
| #48 | Qwen3 Coder Next none | Qwen | 1 | 2.3 | 0/3 | 4.39s |