AI BENCHY زمرہ ناکامیاں
ہدایات کی پیروی: اضافی فارمیٹنگ
ہدایات کی پیروی
اضافی فارمیٹنگ
دیکھیں کہ ہدایات کی پیروی میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #108 | HY3 Preview none | Tencent | 1 | 6.3 | 1/2 | 13.0s |
| #92 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | 1/2 | 17.5s |