ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Claude Sonnet 4.6 2.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.234 প্রতিক্রিয়া সময় (গড়) 39.5s
#159	Hy3 preview low	Tencent	5.9	5.5	$0.015	1/3	40.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 40.4s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 43.3s
#38	GPT-5.6 Terra high	OpenAI	5.3	8.0	$1.055	1/3	43.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.055 প্রতিক্রিয়া সময় (গড়) 43.4s
#29	GPT-5 Mini medium	OpenAI	3.6	8.1	$0.237	0/3	44.6s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 44.6s
#40	Qwen3.7 Plus medium	Qwen	3.6	7.9	$0.267	0/3	45.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.267 প্রতিক্রিয়া সময় (গড়) 45.3s
#42	GLM 5.2 medium	Z.ai	4.1	7.8	$0.187	0/3	45.5s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 45.5s
#45	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 45.5s
#7	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 47.9s
#140	Mimo V2 Omni medium	Xiaomi	3.0	5.9	$0.683	0/3	47.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.683 প্রতিক্রিয়া সময় (গড়) 47.9s
#33	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.515 প্রতিক্রিয়া সময় (গড়) 48.3s
#127	gpt-oss-120b medium	OpenAI	2.9	6.1	$0.019	0/3	50.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.019 প্রতিক্রিয়া সময় (গড়) 50.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	2.9	7.2	$0.317	0/3	53.1s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.317 প্রতিক্রিয়া সময় (গড়) 53.1s
#20	Claude Fable 5 medium	Anthropic	5.3	8.6	$3.478	1/3	53.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $3.478 প্রতিক্রিয়া সময় (গড়) 53.4s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	56.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 56.7s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল