নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: মেট্রিক ↑.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Grok 4.1 Fast 3.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#58	GPT-5.3 Chat none	OpenAI	9.8	7.5	$0.571	2/2	3.51s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 3.51s
#60	GPT-5.4 Mini medium	OpenAI	9.8	7.5	$0.756	2/2	2.13s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.756 প্রতিক্রিয়া সময় (গড়) 2.13s
#71	Step 3.7 Flash low	Stepfun	9.8	7.3	$0.454	2/2	1.58s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 1.58s
#79	Grok 4.20 medium	X AI	9.8	7.1	$0.777	2/2	4.26s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 4.26s
#90	Step 3.7 Flash high	Stepfun	9.8	6.9	$1.207	2/2	1.52s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.207 প্রতিক্রিয়া সময় (গড়) 1.52s
#95	Gemini 3.5 Flash-Lite low	Google	9.8	6.7	$0.145	2/2	869ms
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.145 প্রতিক্রিয়া সময় (গড়) 869ms
#101	GLM 5.2 none	Z.ai	9.8	6.6	$0.128	2/2	3.84s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.128 প্রতিক্রিয়া সময় (গড়) 3.84s
#103	Qwen3.6 Max Preview none	Qwen	9.8	6.6	$0.231	2/2	1.40s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 1.40s
#104	Gemini 3.5 Flash-Lite medium	Google	9.8	6.5	$0.369	2/2	1.59s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.369 প্রতিক্রিয়া সময় (গড়) 1.59s
#108	Laguna XS 2.1 medium	Poolside	9.8	6.5	$0.068	2/2	2.57s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.068 প্রতিক্রিয়া সময় (গড়) 2.57s
#114	Ring-2.6-1T medium	Inclusionai	9.8	6.3	$0.103	2/2	11.8s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.103 প্রতিক্রিয়া সময় (গড়) 11.8s
#129	Inkling low	Thinkingmachines	9.8	6.1	$0.187	2/2	1.81s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 1.81s
#134	GPT-5 Nano medium	OpenAI	9.8	6.1	$0.114	2/2	15.6s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.114 প্রতিক্রিয়া সময় (গড়) 15.6s
#137	Grok 4.20 Beta medium	X AI	9.8	6.0	$0.750	2/2	4.89s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.750 প্রতিক্রিয়া সময় (গড়) 4.89s
#139	Gemini 3 PRO Preview medium	Google	9.8	6.0	$0.385	2/2	3.26s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 3.26s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল