ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Grok 4.5 3.6

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ412 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

210/210

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#45	DeepSeek V4 Flash high	DeepSeek	4.1	7.7	$0.042	0/3	100.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.042 প্রতিক্রিয়া সময় (গড়) 100.3s
#46	DeepSeek V4 Pro high	DeepSeek	3.6	7.7	$0.200	0/3	151.5s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.200 প্রতিক্রিয়া সময় (গড়) 151.5s
#49	GLM 5 Turbo medium	Z.ai	2.9	7.6	$0.323	0/3	71.1s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.323 প্রতিক্রিয়া সময় (গড়) 71.1s
#51	Nemotron 3 Ultra medium	NVIDIA	3.5	7.5	$0.774	0/3	24.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.774 প্রতিক্রিয়া সময় (গড়) 24.9s
#54	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 13.0s
#56	GPT-5.4 Mini medium	OpenAI	4.1	7.5	$0.756	0/3	65.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.756 প্রতিক্রিয়া সময় (গড়) 65.3s
#60	LongCat 2.0 medium	Meituan	2.9	7.4	$0.478	0/3	339.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.478 প্রতিক্রিয়া সময় (গড়) 339.9s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/3	17.5s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.387 প্রতিক্রিয়া সময় (গড়) 17.5s
#64	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.3	$0.115	0/3	4.21s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.115 প্রতিক্রিয়া সময় (গড়) 4.21s
#65	Gemini 3.1 Flash Lite medium	Google	2.9	7.3	$0.117	0/3	3.16s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.117 প্রতিক্রিয়া সময় (গড়) 3.16s
#69	KAT-Coder-Pro V2.5 high	Kwaipilot	2.9	7.2	$0.482	0/3	35.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.482 প্রতিক্রিয়া সময় (গড়) 35.3s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	2.9	7.2	$0.317	0/3	53.1s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.317 প্রতিক্রিয়া সময় (গড়) 53.1s
#71	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.106	0/3	868ms
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.106 প্রতিক্রিয়া সময় (গড়) 868ms
#72	Qwen3.5-122B-A10B medium	Qwen	2.9	7.1	$1.046	0/3	63.4s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $1.046 প্রতিক্রিয়া সময় (গড়) 63.4s
#76	DeepSeek V3.2 medium	DeepSeek	2.9	7.0	$0.078	0/3	24.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 24.3s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল