নির্দেশনা অনুসরণ মডেল র‌্যাঙ্কিং

দেখুন নির্দেশনা অনুসরণ এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় নির্দেশনা অনুসরণ স্কোর

8.5

সেরা মডেল

Kimi K2.5 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ61 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ18 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ3 ব্যর্থতার কারণ কোন উত্তর নেই সহ2 ব্যর্থতার কারণ API ত্রুটি সহ1 ব্যর্থতার কারণ টাইমআউট সহ1

210/210

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#77	Kimi K2.5 medium	Moonshot AI	10.0	7.0	$0.600	2/2	92.5s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.600 প্রতিক্রিয়া সময় (গড়) 92.5s
#163	Gemini 3.1 Flash Lite Preview high	Google	9.8	5.3	$2.310	2/2	64.0s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $2.310 প্রতিক্রিয়া সময় (গড়) 64.0s
#114	Qwen3.5-Flash medium	Qwen	10.0	6.2	$0.139	2/2	63.5s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 63.5s
#99	Qwen3.6 27B medium	Qwen	10.0	6.5	$0.779	2/2	38.0s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 38.0s
#76	DeepSeek V3.2 medium	DeepSeek	10.0	7.0	$0.078	2/2	35.8s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 35.8s
#135	Hy3 preview high	Tencent	10.0	5.9	$0.048	2/2	34.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 34.4s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	2/2	31.9s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.437 প্রতিক্রিয়া সময় (গড়) 31.9s
#171	North Mini Code none	Cohere	6.5	5.1	$0.000	1/2	30.7s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 30.7s
#179	Ring-2.6-1T none	Inclusionai	9.8	4.8	$0.026	2/2	27.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 27.4s
#119	Qwen3.5-35B-A3B medium	Qwen	10.0	6.2	$0.837	2/2	24.4s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.837 প্রতিক্রিয়া সময় (গড়) 24.4s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	24.3s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.143 প্রতিক্রিয়া সময় (গড়) 24.3s
#143	Gemini 3.1 Flash Lite high	Google	7.3	5.6	$2.044	1/2	23.3s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 23.3s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	2/2	20.2s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.317 প্রতিক্রিয়া সময় (গড়) 20.2s
#58	Qwen3.5-27B medium	Qwen	10.0	7.4	$1.627	2/2	19.7s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $1.627 প্রতিক্রিয়া সময় (গড়) 19.7s
#73	Grok 4.3 medium	X AI	9.8	7.1	$0.779	2/2	18.6s
মোট টেস্ট 2 ভুল টেস্ট 0 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 18.6s

1 2 14

→

নির্দেশনা অনুসরণ র‌্যাঙ্কিং

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ স্কোর অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল