নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: মেট্রিক ↑.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Grok 4.1 Fast 3.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#50	DeepSeek V4 Pro high	DeepSeek	7.8	7.7	$0.200	1/2	8.73s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.200 প্রতিক্রিয়া সময় (গড়) 8.73s
#136	Step 3.5 Flash medium	Stepfun	8.3	6.0	$0.108	1/2	4.78s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.108 প্রতিক্রিয়া সময় (গড়) 4.78s
#140	Mimo V2 Omni medium	Xiaomi	8.3	5.9	$0.683	1/2	4.99s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.683 প্রতিক্রিয়া সময় (গড়) 4.99s
#31	Gemini 3.5 Flash-Lite high	Google	8.5	8.1	$0.584	1/2	1.87s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.584 প্রতিক্রিয়া সময় (গড়) 1.87s
#123	GPT-5.6 Luna low	OpenAI	8.5	6.2	$0.249	1/2	2.04s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.249 প্রতিক্রিয়া সময় (গড়) 2.04s
#87	GPT-5.6 Sol none	OpenAI	8.5	6.9	$0.524	1/2	1.33s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.524 প্রতিক্রিয়া সময় (গড়) 1.33s
#138	GPT-5.6 Terra none	OpenAI	8.5	6.0	$0.349	1/2	1.15s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.349 প্রতিক্রিয়া সময় (গড়) 1.15s
#15	Grok 4.5 high	X AI	9.8	8.9	$1.707	2/2	6.23s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.707 প্রতিক্রিয়া সময় (গড়) 6.23s
#23	Grok 4.5 low	X AI	9.8	8.4	$0.935	2/2	2.80s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.935 প্রতিক্রিয়া সময় (গড়) 2.80s
#25	Grok 4.5 medium	X AI	9.8	8.3	$1.928	2/2	6.06s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.928 প্রতিক্রিয়া সময় (গড়) 6.06s
#28	Gemini 2.5 Flash medium	Google	9.8	8.2	$0.643	2/2	2.62s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.643 প্রতিক্রিয়া সময় (গড়) 2.62s
#33	Step 3.7 Flash medium	Stepfun	9.8	8.0	$0.515	2/2	1.83s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.515 প্রতিক্রিয়া সময় (গড়) 1.83s
#34	GPT-5.2 Chat none	OpenAI	9.8	8.0	$0.604	2/2	5.51s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.604 প্রতিক্রিয়া সময় (গড়) 5.51s
#36	Inkling medium	Thinkingmachines	9.8	8.0	$0.391	2/2	6.17s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.391 প্রতিক্রিয়া সময় (গড়) 6.17s
#55	Nemotron 3 Ultra medium	NVIDIA	9.8	7.5	$0.774	2/2	6.35s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.774 প্রতিক্রিয়া সময় (গড়) 6.35s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল