নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Laguna XS 2.1 3.8

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	2/2	2.61s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $2.057 প্রতিক্রিয়া সময় (গড়) 2.61s
#45	Claude Opus 4.8 low	Anthropic	9.8	7.8	$2.077	2/2	2.78s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 2.78s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	2/2	7.25s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.307 প্রতিক্রিয়া সময় (গড়) 7.25s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	2/2	2.43s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $3.059 প্রতিক্রিয়া সময় (গড়) 2.43s
#48	GPT-5.6 Luna high	OpenAI	9.9	7.7	$1.017	2/2	1.79s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.017 প্রতিক্রিয়া সময় (গড়) 1.79s
#49	DeepSeek V4 Flash high	DeepSeek	10.0	7.7	$0.041	2/2	15.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 15.4s
#51	MiniMax M3 medium	Minimax	9.8	7.6	$0.286	2/2	6.14s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 6.14s
#52	Grok Build 0.1 medium	X AI	9.8	7.6	$1.097	2/2	12.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.097 প্রতিক্রিয়া সময় (গড়) 12.4s
#53	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	2/2	5.38s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.323 প্রতিক্রিয়া সময় (গড়) 5.38s
#54	GPT-5.6 Luna medium	OpenAI	9.9	7.6	$0.352	2/2	2.38s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.352 প্রতিক্রিয়া সময় (গড়) 2.38s
#55	Nemotron 3 Ultra medium	NVIDIA	9.8	7.5	$0.774	2/2	6.35s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.774 প্রতিক্রিয়া সময় (গড়) 6.35s
#56	Kimi K2.7 Code medium	Moonshot AI	9.9	7.5	$0.740	2/2	5.39s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 5.39s
#57	GPT-5.4 Nano medium	OpenAI	9.8	7.5	$0.138	2/2	1.88s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 1.88s
#58	GPT-5.3 Chat none	OpenAI	9.8	7.5	$0.571	2/2	3.51s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 3.51s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	2/2	1.48s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 1.48s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল