AI BENCHY
موازنہ کریں چارٹس طریقہ کار
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY زمرہ ناکامیاں

اینٹی اے آئی چالیں
اضافی فارمیٹنگ

دیکھیں کہ اینٹی اے آئی چالیں میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

5

کل ناکامیاں

8

سب سے زیادہ متاثر ماڈل

Claude Sonnet 4.6 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اوسط اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز