ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#119	MiMo-V2-Flash medium	Xiaomi	5.9	6.3	$0.043	1/3	96.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 96.0s
#120	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 146.5s
#124	Gemini 2.5 Flash none	Google	5.9	6.2	$0.017	1/3	495ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.017 প্রতিক্রিয়া সময় (গড়) 495ms
#129	Inkling low	Thinkingmachines	5.3	6.1	$0.187	1/3	1.99s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 1.99s
#130	Qwen3.6 Flash none	Qwen	5.3	6.1	$0.062	1/3	1.11s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.062 প্রতিক্রিয়া সময় (গড়) 1.11s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	5.3	6.1	$0.122	1/3	4.43s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.122 প্রতিক্রিয়া সময় (গড়) 4.43s
#134	GPT-5 Nano medium	OpenAI	5.2	6.1	$0.114	1/3	204.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.114 প্রতিক্রিয়া সময় (গড়) 204.0s
#135	Nemotron 3 Ultra none	NVIDIA	5.3	6.1	$0.095	1/3	698ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 698ms
#136	Step 3.5 Flash medium	Stepfun	5.3	6.0	$0.108	1/3	170.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.108 প্রতিক্রিয়া সময় (গড়) 170.5s
#137	Grok 4.20 Beta medium	X AI	5.3	6.0	$0.750	1/3	21.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.750 প্রতিক্রিয়া সময় (গড়) 21.3s
#138	GPT-5.6 Terra none	OpenAI	5.3	6.0	$0.349	1/3	757ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.349 প্রতিক্রিয়া সময় (গড়) 757ms
#139	Gemini 3 PRO Preview medium	Google	5.3	6.0	$0.385	1/3	7.01s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 7.01s
#141	Hy3 preview high	Tencent	5.3	5.9	$0.048	1/3	109.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 109.0s
#143	North Mini Code medium	Cohere	5.3	5.9	$0.000	1/3	71.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 71.4s
#144	Kimi K2.6 none	Moonshot AI	5.3	5.8	$0.184	1/3	1.48s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.184 প্রতিক্রিয়া সময় (গড়) 1.48s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল