নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Kimi K2.5 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#29	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	11.6s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 11.6s
#152	Owl Alpha medium	Openrouter	6.5	5.6	$0.000	1/2	10.2s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 10.2s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	2/2	9.88s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.046 প্রতিক্রিয়া সময় (গড়) 9.88s
#10	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	2/2	9.56s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.361 প্রতিক্রিয়া সময় (গড়) 9.56s
#215	Step 3.5 Flash none	Stepfun	5.0	2.3	$0.020	1/1	9.30s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.020 প্রতিক্রিয়া সময় (গড়) 9.30s
#131	Qwen3.5-Flash none	Qwen	6.3	6.1	$0.073	1/2	8.81s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 8.81s
#50	DeepSeek V4 Pro high	DeepSeek	7.8	7.7	$0.200	1/2	8.73s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.200 প্রতিক্রিয়া সময় (গড়) 8.73s
#42	GLM 5.2 medium	Z.ai	9.9	7.8	$0.187	2/2	7.90s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 7.90s
#30	Muse Spark 1.1 high	Meta	6.4	8.1	$1.694	1/2	7.81s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 7.81s
#172	Qwen3 Coder Next none	Qwen	6.3	5.1	$0.025	1/2	7.78s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.025 প্রতিক্রিয়া সময় (গড়) 7.78s
#37	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	2/2	7.66s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $3.112 প্রতিক্রিয়া সময় (গড়) 7.66s
#127	gpt-oss-120b medium	OpenAI	9.9	6.1	$0.019	2/2	7.63s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.019 প্রতিক্রিয়া সময় (গড়) 7.63s
#41	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	2/2	7.54s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.405 প্রতিক্রিয়া সময় (গড়) 7.54s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	7.50s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 7.50s
#193	Qwen3 Coder Next medium	Qwen	6.3	4.7	$0.032	1/2	7.49s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.032 প্রতিক্রিয়া সময় (গড়) 7.49s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল