اضافی فارمیٹنگ ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں اضافی فارمیٹنگ سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Grok 4.20 1

زمرے

زمرہ اینٹی اے آئی چالیں میں20 زمرہ کوڈنگ میں18 زمرہ ڈومین مخصوص میں17 زمرہ پہیلی حل کرنا میں8 زمرہ ڈیٹا پارسنگ اور استخراج میں6 زمرہ ہدایات کی پیروی میں3 زمرہ مشترکہ میں1

42/42

درجہ	ماڈل	کمپنی	اضافی فارمیٹنگ کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#197	Grok 4.20 none	X AI	1	4.1	$0.057	6/18	1.11s
کل ٹیسٹس 18 غلط ٹیسٹس 12 کل لاگت $0.057 ردِعمل کا وقت (اوسط) 1.11s
#201	Granite 4.1 8B none	IBM Granite	1	4.0	$0.007	2/22	1.45s
کل ٹیسٹس 22 غلط ٹیسٹس 20 کل لاگت $0.007 ردِعمل کا وقت (اوسط) 1.45s
#159	GPT-5.6 Luna none	OpenAI	1	5.4	$0.142	6/22	1.50s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.142 ردِعمل کا وقت (اوسط) 1.50s
#157	Mimo V2 Omni none	Xiaomi	1	5.5	$0.021	8/21	2.44s
کل ٹیسٹس 21 غلط ٹیسٹس 13 کل لاگت $0.021 ردِعمل کا وقت (اوسط) 2.44s
#200	MiMo-V2-Flash none	Xiaomi	1	4.0	$0.025	4/21	2.76s
کل ٹیسٹس 21 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 2.76s
#164	Inkling none	Thinkingmachines	1	5.2	$0.147	6/22	3.50s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.147 ردِعمل کا وقت (اوسط) 3.50s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 4.62s
#66	Claude Opus 4.8 none	Anthropic	3	7.3	$1.166	13/22	4.91s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $1.166 ردِعمل کا وقت (اوسط) 4.91s
#111	LongCat 2.0 none	Meituan	1	6.3	$0.044	7/22	5.18s
کل ٹیسٹس 22 غلط ٹیسٹس 15 کل لاگت $0.044 ردِعمل کا وقت (اوسط) 5.18s
#112	Claude Sonnet 5 none	Anthropic	4	6.3	$0.548	8/22	6.04s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.548 ردِعمل کا وقت (اوسط) 6.04s
#63	Claude Sonnet 4.6 none	Anthropic	4	7.3	$0.661	12/22	8.12s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.661 ردِعمل کا وقت (اوسط) 8.12s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 8.42s
#166	Qwen3 Coder Next none	Qwen	1	5.1	$0.025	5/22	9.12s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 9.12s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
کل ٹیسٹس 18 غلط ٹیسٹس 10 کل لاگت $5.599 ردِعمل کا وقت (اوسط) 9.69s
#148	Owl Alpha none	Openrouter	1	5.6	$0.000	7/21	9.88s
کل ٹیسٹس 21 غلط ٹیسٹس 14 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 9.88s

اضافی فارمیٹنگ ناکامیاں

ماڈلز فلٹر کریں

اضافی فارمیٹنگ کی تعداد کے لحاظ سے سرفہرست ماڈلز

اضافی فارمیٹنگ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز