اضافی فارمیٹنگ ناکامی درجہ بندی

AI BENCHY ناکامیاں

دیکھیں کہ کن AI ماڈلز میں اضافی فارمیٹنگ سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

متعلقہ زمرے

اینٹی اے آئی چالیں8 ڈومین مخصوص3 پہیلی حل کرنا1 ڈیٹا پارسنگ اور استخراج1

درجہ	ماڈل	کمپنی	اضافی فارمیٹنگ کی تعداد	اوسط اسکور	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#26	Claude Opus 4.6 medium	Anthropic	4	6.6	10/16	22.9s
#25	Claude Sonnet 4.6 none	Anthropic	3	6.8	10/16	5.57s
#11	Claude Sonnet 4.6 medium	Anthropic	2	7.7	12/16	11.2s
#33	DeepSeek V3.2 none	DeepSeek	2	5.5	7/16	12.9s
#48	Qwen3 Coder Next none	Qwen	1	4.0	4/16	11.7s
#54	MiMo-V2-Flash none	Xiaomi	1	2.9	3/16	2.97s

اضافی فارمیٹنگ ناکامیاں