ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Grok 4.5 3.6

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#98	GLM 5V Turbo medium	Z.ai	5.3	6.7	$0.457	1/3	38.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 38.1s
#101	GLM 5.2 none	Z.ai	5.3	6.6	$0.128	1/3	4.04s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.128 প্রতিক্রিয়া সময় (গড়) 4.04s
#106	Hy3 preview medium	Tencent	5.3	6.5	$0.018	1/3	22.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.018 প্রতিক্রিয়া সময় (গড়) 22.3s
#107	MiMo-V2.5 medium	Xiaomi	5.3	6.5	$0.082	1/3	34.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 34.5s
#110	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.646 প্রতিক্রিয়া সময় (গড়) 2.36s
#111	Gemini 3.1 Flash Lite low	Google	5.3	6.5	$0.621	1/3	1.52s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.621 প্রতিক্রিয়া সময় (গড়) 1.52s
#112	Gemini 3.1 Flash Lite Preview none	Google	5.3	6.4	$0.052	1/3	942ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.052 প্রতিক্রিয়া সময় (গড়) 942ms
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	5.3	6.4	$0.073	1/3	1.17s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 1.17s
#115	Mimo V2 PRO medium	Xiaomi	5.3	6.3	$0.333	1/3	8.82s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.333 প্রতিক্রিয়া সময় (গড়) 8.82s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 3.28s
#119	MiMo-V2-Flash medium	Xiaomi	5.9	6.3	$0.043	1/3	96.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 96.0s
#120	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 146.5s
#124	Gemini 2.5 Flash none	Google	5.9	6.2	$0.017	1/3	495ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.017 প্রতিক্রিয়া সময় (গড়) 495ms
#129	Inkling low	Thinkingmachines	5.3	6.1	$0.187	1/3	1.99s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 1.99s
#130	Qwen3.6 Flash none	Qwen	5.3	6.1	$0.062	1/3	1.11s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.062 প্রতিক্রিয়া সময় (গড়) 1.11s

←

1 9 10 11 15

→

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল