AI BENCHY
Advertise here

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: اضافی فارمیٹنگ

ڈومین مخصوص
اضافی فارمیٹنگ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

10

کل ناکامیاں

12

سب سے زیادہ متاثر ماڈل

Grok Build 0.1 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#47 Grok Build 0.1 medium X AI 1 5.3 1/3 158.0s
#69 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#43 MiMo-V2.5-Pro medium Xiaomi 2 5.3 1/3 37.9s
#56 MiMo-V2.5 medium Xiaomi 1 5.3 1/3 34.5s
#65 Grok 4.20 medium X AI 1 5.3 1/3 27.0s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#127 Grok 4.20 none X AI 1 3.0 0/3 687ms
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز