নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Kimi K2.5 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#58	GPT-5.3 Chat none	OpenAI	9.8	7.5	$0.571	2/2	3.51s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 3.51s
#181	Qwen3.6 Plus Preview medium	Qwen	6.5	4.9	$0.000	1/2	3.40s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 3.40s
#83	Gemini 3.5 Flash none	Google	9.8	7.0	$1.079	2/2	3.38s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 3.38s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	3.36s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $4.137 প্রতিক্রিয়া সময় (গড়) 3.36s
#115	Mimo V2 PRO medium	Xiaomi	9.9	6.3	$0.333	2/2	3.36s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.333 প্রতিক্রিয়া সময় (গড়) 3.36s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	2/2	3.35s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.976 প্রতিক্রিয়া সময় (গড়) 3.35s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	2/2	3.32s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.931 প্রতিক্রিয়া সময় (গড়) 3.32s
#139	Gemini 3 PRO Preview medium	Google	9.8	6.0	$0.385	2/2	3.26s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 3.26s
#24	GPT-5.2 medium	OpenAI	9.9	8.4	$0.951	2/2	3.12s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.951 প্রতিক্রিয়া সময় (গড়) 3.12s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	3.11s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.533 প্রতিক্রিয়া সময় (গড়) 3.11s
#26	Claude Sonnet 5 medium	Anthropic	9.9	8.3	$0.922	2/2	3.10s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.922 প্রতিক্রিয়া সময় (গড়) 3.10s
#16	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.04s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 3.04s
#200	GLM 4.7 Flash medium	Z.ai	6.2	4.3	$0.166	1/2	2.97s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.166 প্রতিক্রিয়া সময় (গড়) 2.97s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/2	2.84s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 2.84s
#202	Hunter Alpha none	OpenRouter	6.4	4.2	$0.000	1/2	2.82s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 2.82s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল