নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Kimi K2.5 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#136	Step 3.5 Flash medium	Stepfun	8.3	6.0	$0.108	1/2	4.78s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.108 প্রতিক্রিয়া সময় (গড়) 4.78s
#191	Grok 4.1 Fast medium	X AI	6.5	4.7	$0.069	1/2	4.63s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.069 প্রতিক্রিয়া সময় (গড়) 4.63s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.30s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 4.30s
#119	MiMo-V2-Flash medium	Xiaomi	10.0	6.3	$0.043	2/2	4.28s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 4.28s
#79	Grok 4.20 medium	X AI	9.8	7.1	$0.777	2/2	4.26s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 4.26s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	2/2	4.26s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.817 প্রতিক্রিয়া সময় (গড়) 4.26s
#163	Mimo V2 Omni none	Xiaomi	6.5	5.5	$0.021	1/2	4.26s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 4.26s
#190	Hunter Alpha medium	OpenRouter	9.9	4.7	$0.000	2/2	4.18s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 4.18s
#86	DeepSeek V4 Pro none	DeepSeek	6.3	6.9	$0.096	1/2	4.12s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 4.12s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	2/2	4.04s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.742 প্রতিক্রিয়া সময় (গড়) 4.04s
#2	Gemini 3.6 Flash high	Google	9.9	9.7	$1.785	2/2	3.94s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.785 প্রতিক্রিয়া সময় (গড়) 3.94s
#101	GLM 5.2 none	Z.ai	9.8	6.6	$0.128	2/2	3.84s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.128 প্রতিক্রিয়া সময় (গড়) 3.84s
#9	GPT-5.5 low	OpenAI	9.9	9.3	$1.253	2/2	3.74s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.253 প্রতিক্রিয়া সময় (গড়) 3.74s
#98	GLM 5V Turbo medium	Z.ai	9.9	6.7	$0.457	2/2	3.74s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 3.74s
#187	Grok 4.20 Multi Agent Beta medium	X AI	9.8	4.8	$5.599	2/2	3.52s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $5.599 প্রতিক্রিয়া সময় (গড়) 3.52s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল