AI BENCHY زمرہ ناکامیاں
پہیلی حل کرنا: اضافی فارمیٹنگ
پہیلی حل کرنا
اضافی فارمیٹنگ
دیکھیں کہ پہیلی حل کرنا میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
ناکامی کی وجوہات
| درجہ | ماڈل | کمپنی | اضافی فارمیٹنگ کی تعداد | زمرہ اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #139 | DeepSeek V4 Flash none | DeepSeek | 1 | 3.1 | 0/3 | 23.7s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 7.6 | 2/3 | 16.0s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 6.4 | 1/3 | 5.08s |
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 7.7 | 2/3 | 2.74s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.7 | 2/3 | 2.53s |