ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Claude Sonnet 4.6 2.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.09s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.052 প্রতিক্রিয়া সময় (গড়) 2.09s
#163	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 2.10s
#147	GLM 5 none	Z.ai	3.0	5.7	$0.041	0/3	2.24s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 2.24s
#202	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 2.33s
#110	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.646 প্রতিক্রিয়া সময় (গড়) 2.36s
#162	Gemma 4 26B A4B none	Google	3.6	5.5	$0.015	0/3	2.49s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 2.49s
#154	Owl Alpha none	Openrouter	5.3	5.6	$0.000	1/3	3.00s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 3.00s
#158	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.087 প্রতিক্রিয়া সময় (গড়) 3.03s
#69	Gemini 3.1 Flash Lite medium	Google	2.9	7.3	$0.117	0/3	3.16s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.117 প্রতিক্রিয়া সময় (গড়) 3.16s
#121	Gemma 4 31B none	Google	7.7	6.2	$0.021	2/3	3.22s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 3.22s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 3.28s
#14	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.433 প্রতিক্রিয়া সময় (গড়) 3.39s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.661 প্রতিক্রিয়া সময় (গড়) 3.54s
#95	Gemini 3.5 Flash-Lite low	Google	3.6	6.7	$0.145	0/3	3.63s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.145 প্রতিক্রিয়া সময় (গড়) 3.63s
#86	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 3.72s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল