ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Grok 4.5 3.6

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#205	Hy3 preview none	Tencent	3.6	4.0	$0.003	0/3	17.6s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.003 প্রতিক্রিয়া সময় (গড়) 17.6s
#207	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/3	357ms
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.007 প্রতিক্রিয়া সময় (গড়) 357ms
#208	Grok Build 0.1 none	X AI	3.6	4.0	$0.547	0/3	103.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.547 প্রতিক্রিয়া সময় (গড়) 103.7s
#210	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/3	137.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 137.7s
#212	gpt-oss-120b none	OpenAI	3.0	3.7	$0.010	0/3	35.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 35.0s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	56.7s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 56.7s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	3.2	$0.000	0/3	489ms
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 489ms
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.971 প্রতিক্রিয়া সময় (গড়) 29.1s
#7	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 47.9s
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.234 প্রতিক্রিয়া সময় (গড়) 39.5s
#9	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.253 প্রতিক্রিয়া সময় (গড়) 28.1s
#11	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.116 প্রতিক্রিয়া সময় (গড়) 24.9s
#13	GPT-5.5 medium	OpenAI	5.3	9.0	$4.137	1/3	164.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $4.137 প্রতিক্রিয়া সময় (গড়) 164.1s
#16	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 64.3s
#17	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.931 প্রতিক্রিয়া সময় (গড়) 14.6s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল