AI BENCHY
Advertise here

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: اضافی فارمیٹنگ

ڈومین مخصوص
اضافی فارمیٹنگ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

10

کل ناکامیاں

12

سب سے زیادہ متاثر ماڈل

Claude Sonnet 4.6 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#69 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#127 Grok 4.20 none X AI 1 3.0 0/3 687ms
#43 MiMo-V2.5-Pro medium Xiaomi 2 5.3 1/3 37.9s
#47 Grok Build 0.1 medium X AI 1 5.3 1/3 158.0s
#56 MiMo-V2.5 medium Xiaomi 1 5.3 1/3 34.5s
#65 Grok 4.20 medium X AI 1 5.3 1/3 27.0s

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز