নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Granite 4.1 8B 3.6

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	1.57s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.477 প্রতিক্রিয়া সময় (গড়) 1.57s
#93	Gemini 3 Flash Preview none	Google	6.4	6.8	$0.085	1/2	1.58s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.085 প্রতিক্রিয়া সময় (গড়) 1.58s
#71	Step 3.7 Flash low	Stepfun	9.8	7.3	$0.454	2/2	1.58s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 1.58s
#104	Gemini 3.5 Flash-Lite medium	Google	9.8	6.5	$0.369	2/2	1.59s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.369 প্রতিক্রিয়া সময় (গড়) 1.59s
#144	Kimi K2.6 none	Moonshot AI	6.5	5.8	$0.184	1/2	1.64s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.184 প্রতিক্রিয়া সময় (গড়) 1.64s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	9.8	5.4	$0.041	2/2	1.64s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 1.64s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	10.0	6.4	$0.073	2/2	1.67s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 1.67s
#204	Laguna Xs.2 medium	Poolside	10.0	4.1	$0.015	2/2	1.68s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 1.68s
#170	Inkling none	Thinkingmachines	6.3	5.2	$0.147	1/2	1.72s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.147 প্রতিক্রিয়া সময় (গড়) 1.72s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	9.9	4.8	$0.067	2/2	1.75s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.067 প্রতিক্রিয়া সময় (গড়) 1.75s
#48	GPT-5.6 Luna high	OpenAI	9.9	7.7	$1.017	2/2	1.79s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.017 প্রতিক্রিয়া সময় (গড়) 1.79s
#107	MiMo-V2.5 medium	Xiaomi	9.9	6.5	$0.082	2/2	1.80s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.082 প্রতিক্রিয়া সময় (গড়) 1.80s
#129	Inkling low	Thinkingmachines	9.8	6.1	$0.187	2/2	1.81s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 1.81s
#33	Step 3.7 Flash medium	Stepfun	9.8	8.0	$0.515	2/2	1.83s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.515 প্রতিক্রিয়া সময় (গড়) 1.83s
#167	Qwen3.6 35B A3B none	Qwen	6.2	5.3	$0.061	1/2	1.86s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.061 প্রতিক্রিয়া সময় (গড়) 1.86s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল