ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#78	GLM 5.1 medium	Z.ai	5.3	7.1	$0.535	1/3	29.8s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.535 প্রতিক্রিয়া সময় (গড়) 29.8s
#79	Grok 4.20 medium	X AI	5.3	7.1	$0.777	1/3	27.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 27.0s
#86	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 3.72s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.3	6.9	$0.187	1/3	37.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 37.9s
#94	Qwen3.6 35B A3B medium	Qwen	5.3	6.7	$0.746	1/3	22.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 22.5s
#98	GLM 5V Turbo medium	Z.ai	5.3	6.7	$0.457	1/3	38.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 38.1s
#101	GLM 5.2 none	Z.ai	5.3	6.6	$0.128	1/3	4.04s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.128 প্রতিক্রিয়া সময় (গড়) 4.04s
#106	Hy3 preview medium	Tencent	5.3	6.5	$0.018	1/3	22.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.018 প্রতিক্রিয়া সময় (গড়) 22.3s
#107	MiMo-V2.5 medium	Xiaomi	5.3	6.5	$0.082	1/3	34.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 34.5s
#110	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.646 প্রতিক্রিয়া সময় (গড়) 2.36s
#111	Gemini 3.1 Flash Lite low	Google	5.3	6.5	$0.621	1/3	1.52s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.621 প্রতিক্রিয়া সময় (গড়) 1.52s
#112	Gemini 3.1 Flash Lite Preview none	Google	5.3	6.4	$0.052	1/3	942ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.052 প্রতিক্রিয়া সময় (গড়) 942ms
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	5.3	6.4	$0.073	1/3	1.17s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 1.17s
#115	Mimo V2 PRO medium	Xiaomi	5.3	6.3	$0.333	1/3	8.82s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.333 প্রতিক্রিয়া সময় (গড়) 8.82s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 3.28s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল