AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: اضافی فارمیٹنگ

ڈومین مخصوص
اضافی فارمیٹنگ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔

دکھائے گئے ماڈلز

7

کل ناکامیاں

8

سب سے زیادہ متاثر ماڈل

Claude Opus 4.6 2
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#37 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#35 MiMo-V2-Omni medium Xiaomi 1 3.0 0/3 55.1s
#47 Grok 4.20 medium X AI 1 5.3 1/3 27.0s
#50 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#56 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#82 Grok 4.20 none X AI 1 3.0 0/3 687ms

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز