AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

پہیلی حل کرنا: اضافی فارمیٹنگ

پہیلی حل کرنا
اضافی فارمیٹنگ

دیکھیں کہ پہیلی حل کرنا میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

5

کل ناکامیاں

5

سب سے زیادہ متاثر ماڈل

Claude Opus 4.8 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز