ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়।

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#13	GPT-5.5 medium	OpenAI	5.3	9.0	$4.137	1/3	164.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $4.137 প্রতিক্রিয়া সময় (গড়) 164.1s
#20	Claude Fable 5 medium	Anthropic	5.3	8.6	$3.478	1/3	53.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $3.478 প্রতিক্রিয়া সময় (গড়) 53.4s
#21	GPT-5.4 medium	OpenAI	5.3	8.5	$1.533	1/3	74.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.533 প্রতিক্রিয়া সময় (গড়) 74.3s
#31	Gemini 3.5 Flash-Lite high	Google	5.3	8.1	$0.584	1/3	19.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.584 প্রতিক্রিয়া সময় (গড়) 19.5s
#36	Inkling medium	Thinkingmachines	5.3	8.0	$0.391	1/3	35.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.391 প্রতিক্রিয়া সময় (গড়) 35.6s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 8.34s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 8.05s
#70	Claude Opus 4.8 none	Anthropic	5.3	7.3	$1.166	1/3	1.70s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 1.70s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 43.3s
#72	Kimi K2.6 medium	Moonshot AI	5.3	7.2	$1.036	1/3	202.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.036 প্রতিক্রিয়া সময় (গড়) 202.4s
#77	Grok 4.3 medium	X AI	5.3	7.1	$0.779	1/3	181.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 181.7s
#94	Qwen3.6 35B A3B medium	Qwen	5.3	6.7	$0.746	1/3	22.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 22.5s
#98	GLM 5V Turbo medium	Z.ai	5.3	6.7	$0.457	1/3	38.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 38.1s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 3.28s
#120	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 146.5s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল