ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Claude Sonnet 4.6 2.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#104	Gemini 3.5 Flash-Lite medium	Google	2.9	6.5	$0.369	0/3	6.62s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.369 প্রতিক্রিয়া সময় (গড়) 6.62s
#139	Gemini 3 PRO Preview medium	Google	5.3	6.0	$0.385	1/3	7.01s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 7.01s
#167	Qwen3.6 35B A3B none	Qwen	3.5	5.3	$0.061	0/3	7.45s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.061 প্রতিক্রিয়া সময় (গড়) 7.45s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	2.9	5.6	$0.077	0/3	7.47s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 7.47s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 8.05s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 8.34s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	8.58s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 8.58s
#115	Mimo V2 PRO medium	Xiaomi	5.3	6.3	$0.333	1/3	8.82s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.333 প্রতিক্রিয়া সময় (গড়) 8.82s
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.249 প্রতিক্রিয়া সময় (গড়) 10.0s
#190	Hunter Alpha medium	OpenRouter	3.0	4.7	$0.000	0/3	10.5s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 10.5s
#83	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 10.6s
#204	Laguna Xs.2 medium	Poolside	4.1	4.1	$0.015	0/3	11.1s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 11.1s
#1	Gemini 3.6 Flash medium	Google	8.2	9.9	$0.831	2/3	12.6s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.831 প্রতিক্রিয়া সময় (গড়) 12.6s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 13.0s
#4	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.976 প্রতিক্রিয়া সময় (গড়) 14.1s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল