ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Kimi K3 5.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#107	MiMo-V2.5 medium	Xiaomi	5.3	6.5	$0.082	1/3	34.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 34.5s
#10	Gemini 3.1 Pro Preview medium	Google	7.7	9.2	$1.361	2/3	32.7s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.361 প্রতিক্রিয়া সময় (গড়) 32.7s
#78	GLM 5.1 medium	Z.ai	5.3	7.1	$0.535	1/3	29.8s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.535 প্রতিক্রিয়া সময় (গড়) 29.8s
#27	Muse Spark 1.1 low	Meta	2.9	8.3	$0.647	0/3	29.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.647 প্রতিক্রিয়া সময় (গড়) 29.7s
#41	Qwen3.6 Plus medium	Qwen	2.9	7.8	$0.405	0/3	29.6s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.405 প্রতিক্রিয়া সময় (গড়) 29.6s
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.971 প্রতিক্রিয়া সময় (গড়) 29.1s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	2.9	6.9	$0.467	0/3	29.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.467 প্রতিক্রিয়া সময় (গড়) 29.0s
#9	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.253 প্রতিক্রিয়া সময় (গড়) 28.1s
#79	Grok 4.20 medium	X AI	5.3	7.1	$0.777	1/3	27.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 27.0s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	3/3	26.0s
মোট টেস্ট 3 ভুল টেস্ট 0 মোট খরচ $1.785 প্রতিক্রিয়া সময় (গড়) 26.0s
#11	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.116 প্রতিক্রিয়া সময় (গড়) 24.9s
#55	Nemotron 3 Ultra medium	NVIDIA	3.5	7.5	$0.774	0/3	24.9s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.774 প্রতিক্রিয়া সময় (গড়) 24.9s
#187	Grok 4.20 Multi Agent Beta medium	X AI	2.9	4.8	$5.599	0/3	24.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $5.599 প্রতিক্রিয়া সময় (গড়) 24.7s
#80	DeepSeek V3.2 medium	DeepSeek	2.9	7.0	$0.078	0/3	24.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 24.3s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	24.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 24.1s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল