ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#43	GPT-5.6 Terra medium	OpenAI	5.3	7.8	$0.676	1/3	23.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.676 প্রতিক্রিয়া সময় (গড়) 23.4s
#45	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 45.5s
#51	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/3	233.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 233.1s
#52	Grok Build 0.1 medium	X AI	5.3	7.6	$1.097	1/3	158.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.097 প্রতিক্রিয়া সময় (গড়) 158.0s
#54	GPT-5.6 Luna medium	OpenAI	5.3	7.6	$0.352	1/3	17.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.352 প্রতিক্রিয়া সময় (গড়) 17.4s
#56	Kimi K2.7 Code medium	Moonshot AI	5.5	7.5	$0.740	1/3	213.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 213.3s
#57	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 38.2s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 8.34s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	5.3	7.5	$0.437	1/3	17.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.437 প্রতিক্রিয়া সময় (গড়) 17.5s
#62	Qwen3.5-27B medium	Qwen	5.3	7.4	$1.627	1/3	79.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.627 প্রতিক্রিয়া সময় (গড়) 79.5s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 8.05s
#70	Claude Opus 4.8 none	Anthropic	5.3	7.3	$1.166	1/3	1.70s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 1.70s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 43.3s
#72	Kimi K2.6 medium	Moonshot AI	5.3	7.2	$1.036	1/3	202.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.036 প্রতিক্রিয়া সময় (গড়) 202.4s
#77	Grok 4.3 medium	X AI	5.3	7.1	$0.779	1/3	181.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 181.7s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল