নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়।

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.6

সেরা মডেল

Gemini 3 Flash Preview 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ19 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#32	Inkling high	Thinkingmachines	9.8	8.0	$1.006	2/2	7.00s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.006 প্রতিক্রিয়া সময় (গড়) 7.00s
#45	Claude Opus 4.8 low	Anthropic	9.8	7.8	$2.077	2/2	2.78s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 2.78s
#51	MiniMax M3 medium	Minimax	9.8	7.6	$0.286	2/2	6.14s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 6.14s
#52	Grok Build 0.1 medium	X AI	9.8	7.6	$1.097	2/2	12.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.097 প্রতিক্রিয়া সময় (গড়) 12.4s
#57	GPT-5.4 Nano medium	OpenAI	9.8	7.5	$0.138	2/2	1.88s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 1.88s
#77	Grok 4.3 medium	X AI	9.8	7.1	$0.779	2/2	18.6s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 18.6s
#83	Gemini 3.5 Flash none	Google	9.8	7.0	$1.079	2/2	3.38s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 3.38s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	9.8	6.7	$0.476	2/2	2.61s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.476 প্রতিক্রিয়া সময় (গড়) 2.61s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	9.8	5.6	$0.077	2/2	1.51s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 1.51s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	9.8	5.4	$0.041	2/2	1.64s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 1.64s
#184	Ling-2.6-flash none	Inclusionai	9.8	4.9	$0.002	2/2	5.52s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.002 প্রতিক্রিয়া সময় (গড়) 5.52s
#194	Cobuddy medium	Baidu	9.8	4.7	$0.000	2/2	11.6s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 11.6s
#199	Elephant Alpha none	Openrouter	9.8	4.3	$0.000	2/2	1.03s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 1.03s
#201	Elephant Alpha medium	Openrouter	9.8	4.3	$0.000	2/2	987ms
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 987ms
#15	Grok 4.5 high	X AI	9.8	8.9	$1.707	2/2	6.23s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.707 প্রতিক্রিয়া সময় (গড়) 6.23s

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল