AI BENCHY زمرہ ناکامیاں
ڈومین مخصوص
اضافی فارمیٹنگ
ڈومین مخصوص
اضافی فارمیٹنگ
دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔
متعلقہ ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #26 | Claude Opus 4.6 medium | Anthropic | 2 | 10.0 | 0/3 | 83.4s |
| #11 | Claude Sonnet 4.6 medium | Anthropic | 1 | 10.0 | 0/3 | 0ms |