ডোমেইন-নির্দিষ্ট মডেল র‌্যাঙ্কিং

দেখুন ডোমেইন-নির্দিষ্ট এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় ডোমেইন-নির্দিষ্ট স্কোর

4.7

সেরা মডেল

Kimi K3 5.9

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ421 ব্যর্থতার কারণ টাইমআউট সহ43 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ17 ব্যর্থতার কারণ কোন উত্তর নেই সহ8 ব্যর্থতার কারণ API ত্রুটি সহ7 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ডোমেইন-নির্দিষ্ট স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#40	Qwen3.7 Plus medium	Qwen	3.6	7.9	$0.267	0/3	45.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.267 প্রতিক্রিয়া সময় (গড়) 45.3s
#29	GPT-5 Mini medium	OpenAI	3.6	8.1	$0.237	0/3	44.6s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 44.6s
#38	GPT-5.6 Terra high	OpenAI	5.3	8.0	$1.055	1/3	43.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.055 প্রতিক্রিয়া সময় (গড়) 43.4s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 43.3s
#159	Hy3 preview low	Tencent	5.9	5.5	$0.015	1/3	40.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 40.4s
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $1.234 প্রতিক্রিয়া সময় (গড়) 39.5s
#116	Gemma 4 31B medium	Google	7.7	6.3	$0.107	2/3	38.5s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.107 প্রতিক্রিয়া সময় (গড়) 38.5s
#57	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 38.2s
#98	GLM 5V Turbo medium	Z.ai	5.3	6.7	$0.457	1/3	38.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 38.1s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.3	6.9	$0.187	1/3	37.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 37.9s
#28	Gemini 2.5 Flash medium	Google	5.9	8.2	$0.643	1/3	37.3s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.643 প্রতিক্রিয়া সময় (গড়) 37.3s
#36	Inkling medium	Thinkingmachines	5.3	8.0	$0.391	1/3	35.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.391 প্রতিক্রিয়া সময় (গড়) 35.6s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	2.9	7.2	$0.482	0/3	35.3s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.482 প্রতিক্রিয়া সময় (গড়) 35.3s
#212	gpt-oss-120b none	OpenAI	3.0	3.7	$0.010	0/3	35.0s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 35.0s
#215	Step 3.5 Flash none	Stepfun	3.3	2.3	$0.020	1/1	34.5s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.020 প্রতিক্রিয়া সময় (গড়) 34.5s

ডোমেইন-নির্দিষ্ট র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ডোমেইন-নির্দিষ্ট স্কোর অনুযায়ী শীর্ষ মডেল

ডোমেইন-নির্দিষ্ট স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল