AI BENCHY زمرہ ناکامیاں
پہیلی حل کرنا
اضافی فارمیٹنگ
پہیلی حل کرنا
اضافی فارمیٹنگ
دیکھیں کہ پہیلی حل کرنا میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.
متعلقہ ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #25 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.0 | 2/3 | 2.92s |