অতিরিক্ত ফরম্যাটিং ব্যর্থতা র‌্যাঙ্কিং

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি অতিরিক্ত ফরম্যাটিং সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন।

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

Claude Opus 4.6 5

বিভাগ

অ্যান্টি-এআই কৌশল বিভাগে20 কোডিং বিভাগে18 ডোমেইন-নির্দিষ্ট বিভাগে17 ধাঁধা সমাধান বিভাগে7 ডেটা পার্সিং ও নিষ্কাশন বিভাগে6 নির্দেশনা অনুসরণ বিভাগে3 সমন্বিত বিভাগে1

41/41

র‍্যাঙ্ক	মডেল	কোম্পানি	অতিরিক্ত ফরম্যাটিং সংখ্যা	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#43	Claude Opus 4.6 medium	Anthropic	5	7.7	$3.059	13/22	34.3s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $3.059 প্রতিক্রিয়া সময় (গড়) 34.3s
#62	Claude Sonnet 4.6 none	Anthropic	4	7.3	$0.661	12/22	8.12s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.661 প্রতিক্রিয়া সময় (গড়) 8.12s
#108	Claude Sonnet 5 none	Anthropic	4	6.3	$0.548	8/22	6.04s
মোট টেস্ট 22 ভুল টেস্ট 14 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 6.04s
#154	KAT-Coder-Air V2.5 low	Kwaipilot	4	5.4	$0.041	7/22	10.1s
মোট টেস্ট 22 ভুল টেস্ট 15 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 10.1s
#40	Claude Sonnet 4.6 medium	Anthropic	3	7.8	$2.057	14/22	25.9s
মোট টেস্ট 22 ভুল টেস্ট 8 মোট খরচ $2.057 প্রতিক্রিয়া সময় (গড়) 25.9s
#48	Grok Build 0.1 medium	X AI	3	7.6	$1.097	14/22	52.1s
মোট টেস্ট 22 ভুল টেস্ট 8 মোট খরচ $1.097 প্রতিক্রিয়া সময় (গড়) 52.1s
#65	Claude Opus 4.8 none	Anthropic	3	7.3	$1.166	13/22	4.91s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 4.91s
#83	MiMo-V2.5-Pro medium	Xiaomi	3	6.9	$0.187	12/22	33.9s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 33.9s
#140	KAT-Coder-Air V2.5 high	Kwaipilot	3	5.6	$0.077	7/22	15.9s
মোট টেস্ট 22 ভুল টেস্ট 15 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 15.9s
#178	KAT-Coder-Air V2.5 none	Kwaipilot	3	4.8	$0.067	5/22	12.2s
মোট টেস্ট 22 ভুল টেস্ট 17 মোট খরচ $0.067 প্রতিক্রিয়া সময় (গড়) 12.2s
#98	MiMo-V2.5 medium	Xiaomi	2	6.5	$0.082	12/22	32.2s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 32.2s
#133	North Mini Code medium	Cohere	2	5.9	$0.000	9/22	137.1s
মোট টেস্ট 22 ভুল টেস্ট 13 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 137.1s
#146	DeepSeek V4 Flash none	DeepSeek	2	5.6	$0.044	5/22	36.8s
মোট টেস্ট 22 ভুল টেস্ট 17 মোট খরচ $0.044 প্রতিক্রিয়া সময় (গড়) 36.8s
#167	North Mini Code none	Cohere	2	5.1	$0.000	4/22	29.9s
মোট টেস্ট 22 ভুল টেস্ট 18 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 29.9s
#169	DeepSeek V3.2 none	DeepSeek	2	5.0	$0.054	6/22	18.3s
মোট টেস্ট 22 ভুল টেস্ট 16 মোট খরচ $0.054 প্রতিক্রিয়া সময় (গড়) 18.3s

অতিরিক্ত ফরম্যাটিং ব্যর্থতা

মডেল ফিল্টার করুন

অতিরিক্ত ফরম্যাটিং সংখ্যা অনুযায়ী শীর্ষ মডেল

অতিরিক্ত ফরম্যাটিং সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল