কোন উত্তর নেই ব্যর্থতা র‌্যাঙ্কিং

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি কোন উত্তর নেই সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

Claude Opus 4.8 1

বিভাগ

সমন্বিত বিভাগে29 কোডিং বিভাগে18 সাধারণ জ্ঞান বিভাগে13 ডেটা পার্সিং ও নিষ্কাশন বিভাগে8 ডোমেইন-নির্দিষ্ট বিভাগে8 অ্যান্টি-এআই কৌশল বিভাগে4 ধাঁধা সমাধান বিভাগে3 টুল কলিং বিভাগে2 নির্দেশনা অনুসরণ বিভাগে2

67/67

র‍্যাঙ্ক	মডেল	কোম্পানি	কোন উত্তর নেই সংখ্যা	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#110	Gemma 4 31B medium	Google	1	6.3	$0.163	14/22	75.4s
মোট টেস্ট 22 ভুল টেস্ট 8 মোট খরচ $0.163 প্রতিক্রিয়া সময় (গড়) 75.4s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 4.91s
#73	Grok 4.3 medium	X AI	1	7.1	$0.779	13/22	47.4s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 47.4s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $0.535 প্রতিক্রিয়া সময় (গড়) 46.8s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $0.085 প্রতিক্রিয়া সময় (গড়) 2.95s
#90	Qwen3.6 35B A3B medium	Qwen	1	6.7	$0.746	13/22	58.1s
মোট টেস্ট 22 ভুল টেস্ট 9 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 58.1s
#143	Gemini 3.1 Flash Lite high	Google	1	5.6	$2.044	10/18	62.0s
মোট টেস্ট 18 ভুল টেস্ট 8 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 62.0s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 27.6s
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 31.5s
#47	MiniMax M3 medium	Minimax	1	7.6	$0.286	12/22	75.0s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 75.0s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.478 প্রতিক্রিয়া সময় (গড়) 136.6s
#67	Step 3.7 Flash low	Stepfun	1	7.3	$0.454	12/22	20.7s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 20.7s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $1.036 প্রতিক্রিয়া সময় (গড়) 110.0s
#101	MiMo-V2.5 medium	Xiaomi	1	6.5	$0.082	12/22	32.2s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 32.2s
#106	Gemini 3.1 Flash Lite Preview none	Google	1	6.4	$0.052	12/22	1.58s
মোট টেস্ট 22 ভুল টেস্ট 10 মোট খরচ $0.052 প্রতিক্রিয়া সময় (গড়) 1.58s

←

1 2 3 4 5

→

কোন উত্তর নেই ব্যর্থতা

মডেল ফিল্টার করুন

কোন উত্তর নেই সংখ্যা অনুযায়ী শীর্ষ মডেল

কোন উত্তর নেই সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল