নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Laguna XS 2.1 3.8

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#205	Hy3 preview none	Tencent	6.3	4.0	$0.003	1/2	13.0s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.003 প্রতিক্রিয়া সময় (গড়) 13.0s
#206	MiMo-V2-Flash none	Xiaomi	6.5	4.0	$0.025	1/2	857ms
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.025 প্রতিক্রিয়া সময় (গড়) 857ms
#210	Qwen3.5-9B medium	Qwen	6.5	3.8	$0.036	1/2	5.75s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 5.75s
#211	Laguna Xs.2 none	Poolside	6.5	3.8	$0.004	1/2	439ms
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 439ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	1.37s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 1.37s
#216	LFM2-24B-A2B none	Liquid	6.3	2.2	$0.001	1/2	752ms
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.001 প্রতিক্রিয়া সময় (গড়) 752ms
#1	Gemini 3.6 Flash medium	Google	9.9	9.9	$0.831	2/2	2.77s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.831 প্রতিক্রিয়া সময় (গড়) 2.77s
#2	Gemini 3.6 Flash high	Google	9.9	9.7	$1.785	2/2	3.94s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.785 প্রতিক্রিয়া সময় (গড়) 3.94s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	2/2	4.04s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.742 প্রতিক্রিয়া সময় (গড়) 4.04s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	2/2	3.35s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.976 প্রতিক্রিয়া সময় (গড়) 3.35s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	2.27s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.971 প্রতিক্রিয়া সময় (গড়) 2.27s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	2/2	2.05s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.517 প্রতিক্রিয়া সময় (গড়) 2.05s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	2.50s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 2.50s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	2/2	2.73s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.234 প্রতিক্রিয়া সময় (গড়) 2.73s
#9	GPT-5.5 low	OpenAI	9.9	9.3	$1.253	2/2	3.74s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.253 প্রতিক্রিয়া সময় (গড়) 3.74s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল