ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Kimi K3 5.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 67.4s
#108	Laguna XS 2.1 medium	Poolside	2.9	6.5	$0.068	0/3	65.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.068 প্রতিক্রিয়া সময় (গড়) 65.7s
#60	GPT-5.4 Mini medium	OpenAI	4.1	7.5	$0.756	0/3	65.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.756 প্রতিক্রিয়া সময় (গড়) 65.3s
#114	Ring-2.6-1T medium	Inclusionai	3.5	6.3	$0.103	0/3	64.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.103 প্রতিক্রিয়া সময় (গড়) 64.9s
#16	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 64.3s
#76	Qwen3.5-122B-A10B medium	Qwen	2.9	7.1	$1.046	0/3	63.4s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $1.046 প্রতিক্রিয়া সময় (গড়) 63.4s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	56.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 56.7s
#20	Claude Fable 5 medium	Anthropic	5.3	8.6	$3.478	1/3	53.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $3.478 প্রতিক্রিয়া সময় (গড়) 53.4s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	2.9	7.2	$0.317	0/3	53.1s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.317 প্রতিক্রিয়া সময় (গড়) 53.1s
#127	gpt-oss-120b medium	OpenAI	2.9	6.1	$0.019	0/3	50.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.019 প্রতিক্রিয়া সময় (গড়) 50.9s
#33	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.515 প্রতিক্রিয়া সময় (গড়) 48.3s
#140	Mimo V2 Omni medium	Xiaomi	3.0	5.9	$0.683	0/3	47.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.683 প্রতিক্রিয়া সময় (গড়) 47.9s
#7	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 47.9s
#45	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 45.5s
#42	GLM 5.2 medium	Z.ai	4.1	7.8	$0.187	0/3	45.5s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 45.5s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল