AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

ڈومین مخصوص: اضافی فارمیٹنگ

ڈومین مخصوص
اضافی فارمیٹنگ

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

10

کل ناکامیاں

12

سب سے زیادہ متاثر ماڈل

Claude Sonnet 4.6 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#127 Grok 4.20 none X AI 1 3.0 0/3 687ms
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#65 Grok 4.20 medium X AI 1 5.3 1/3 27.0s
#56 MiMo-V2.5 medium Xiaomi 1 5.3 1/3 34.5s
#43 MiMo-V2.5-Pro medium Xiaomi 2 5.3 1/3 37.9s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#69 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#47 Grok Build 0.1 medium X AI 1 5.3 1/3 158.0s

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز