ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Grok 4.5 3.6

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#56	Kimi K2.7 Code medium	Moonshot AI	5.5	7.5	$0.740	1/3	213.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 213.3s
#57	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 38.2s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 8.34s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	5.3	7.5	$0.437	1/3	17.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.437 প্রতিক্রিয়া সময় (গড়) 17.5s
#62	Qwen3.5-27B medium	Qwen	5.3	7.4	$1.627	1/3	79.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.627 প্রতিক্রিয়া সময় (গড়) 79.5s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 8.05s
#70	Claude Opus 4.8 none	Anthropic	5.3	7.3	$1.166	1/3	1.70s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 1.70s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 43.3s
#72	Kimi K2.6 medium	Moonshot AI	5.3	7.2	$1.036	1/3	202.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.036 প্রতিক্রিয়া সময় (গড়) 202.4s
#77	Grok 4.3 medium	X AI	5.3	7.1	$0.779	1/3	181.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 181.7s
#78	GLM 5.1 medium	Z.ai	5.3	7.1	$0.535	1/3	29.8s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.535 প্রতিক্রিয়া সময় (গড়) 29.8s
#79	Grok 4.20 medium	X AI	5.3	7.1	$0.777	1/3	27.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 27.0s
#86	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 3.72s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.3	6.9	$0.187	1/3	37.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 37.9s
#94	Qwen3.6 35B A3B medium	Qwen	5.3	6.7	$0.746	1/3	22.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 22.5s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল