Sadharon Buddhimotta x নির্দেশনা অনুসরণ করা হয়নি র‌্যাঙ্কিং

দেখুন Sadharon Buddhimotta এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

Qwen3.5-27B 1

ব্যর্থতার কারণ

নির্দেশনা অনুসরণ করা হয়নি78 ভুল উত্তর59 API ত্রুটি12 টাইমআউট4

বিভাগ

ধাঁধা সমাধান90 Sadharon Buddhimotta78 অ্যান্টি-এআই কৌশল33 নির্দেশনা অনুসরণ18 কোডিং16 টুল কলিং8 ডোমেইন-নির্দিষ্ট1 সমন্বিত1

78/78

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ করা হয়নি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#58	Qwen3.5-27B medium	Qwen	1	6.1	$1.627	0/1	101.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.627 প্রতিক্রিয়া সময় (গড়) 101.4s
#77	Kimi K2.5 medium	Moonshot AI	1	6.5	$0.600	0/1	69.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.600 প্রতিক্রিয়া সময় (গড়) 69.7s
#146	Owl Alpha medium	Openrouter	1	4.3	$0.000	0/1	58.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 58.6s
#108	Ring-2.6-1T medium	Inclusionai	1	4.1	$0.103	0/1	58.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.103 প্রতিক্রিয়া সময় (গড়) 58.3s
#143	Gemini 3.1 Flash Lite high	Google	1	5.0	$2.044	0/1	45.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 45.7s
#114	Qwen3.5-Flash medium	Qwen	1	6.1	$0.139	0/1	40.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 40.1s
#99	Qwen3.6 27B medium	Qwen	1	6.5	$0.779	0/1	39.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 39.5s
#172	MiniMax M2.7 medium	Minimax	1	3.9	$0.163	0/1	38.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.163 প্রতিক্রিয়া সময় (গড়) 38.7s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	5.1	$0.101	0/1	36.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.101 প্রতিক্রিয়া সময় (গড়) 36.7s
#47	MiniMax M3 medium	Minimax	1	5.1	$0.286	0/1	33.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 33.3s
#37	Qwen3.6 Plus medium	Qwen	1	5.1	$0.405	0/1	27.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.405 প্রতিক্রিয়া সময় (গড়) 27.1s
#45	DeepSeek V4 Flash high	DeepSeek	1	6.1	$0.042	0/1	25.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.042 প্রতিক্রিয়া সময় (গড়) 25.2s
#73	Grok 4.3 medium	X AI	1	5.4	$0.779	0/1	24.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 24.7s
#75	Grok 4.20 medium	X AI	1	3.9	$0.777	0/1	24.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 24.5s
#188	Cobuddy medium	Baidu	1	4.2	$0.000	0/1	23.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 23.2s

1 2 3 4 5 6

→

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

Sadharon Buddhimotta: নির্দেশনা অনুসরণ করা হয়নি

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল