AI BENCHY
Advertise here

AI BENCHY زمرہ ناکامیاں

پہیلی حل کرنا: اضافی فارمیٹنگ

پہیلی حل کرنا
اضافی فارمیٹنگ

دیکھیں کہ پہیلی حل کرنا میں کن AI ماڈلز کو اضافی فارمیٹنگ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

5

کل ناکامیاں

5

سب سے زیادہ متاثر ماڈل

DeepSeek V4 Flash 1
درجہ ماڈل کمپنی اضافی فارمیٹنگ کی تعداد زمرہ اسکور درست ٹیسٹس ردِعمل کا وقت (اوسط)
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز