Sadharon Buddhimotta x নির্দেশনা অনুসরণ করা হয়নি র‌্যাঙ্কিং

দেখুন Sadharon Buddhimotta এ কোন AI মডেলগুলোর নির্দেশনা অনুসরণ করা হয়নি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: ব্যর্থতার সংখ্যা ↑.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

Grok 4.5 1

ব্যর্থতার কারণ

নির্দেশনা অনুসরণ করা হয়নি78 ভুল উত্তর59 API ত্রুটি12 টাইমআউট4

বিভাগ

ধাঁধা সমাধান90 Sadharon Buddhimotta78 অ্যান্টি-এআই কৌশল33 নির্দেশনা অনুসরণ18 কোডিং16 টুল কলিং8 ডোমেইন-নির্দিষ্ট1 সমন্বিত1

78/78

র‍্যাঙ্ক	মডেল	কোম্পানি	নির্দেশনা অনুসরণ করা হয়নি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#12	Grok 4.5 high	X AI	1	4.7	$1.707	0/1	9.82s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.707 প্রতিক্রিয়া সময় (গড়) 9.82s
#13	GPT-5.3-Codex medium	OpenAI	1	4.6	$0.920	0/1	4.87s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 4.87s
#18	GPT-5.4 medium	OpenAI	1	4.7	$1.533	0/1	4.92s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.533 প্রতিক্রিয়া সময় (গড়) 4.92s
#21	GPT-5.2 medium	OpenAI	1	3.7	$0.951	0/1	4.32s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.951 প্রতিক্রিয়া সময় (গড়) 4.32s
#23	Claude Sonnet 5 medium	Anthropic	1	4.8	$0.922	0/1	4.32s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.922 প্রতিক্রিয়া সময় (গড়) 4.32s
#25	Gemini 2.5 Flash medium	Google	1	4.8	$0.643	0/1	4.86s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.643 প্রতিক্রিয়া সময় (গড়) 4.86s
#26	GPT-5 Mini medium	OpenAI	1	4.5	$0.237	0/1	13.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 13.5s
#30	GPT-5.2 Chat none	OpenAI	1	4.4	$0.604	0/1	3.20s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.604 প্রতিক্রিয়া সময় (গড়) 3.20s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	6.7	$0.234	0/1	18.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.234 প্রতিক্রিয়া সময় (গড়) 18.2s
#37	Qwen3.6 Plus medium	Qwen	1	5.1	$0.405	0/1	27.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.405 প্রতিক্রিয়া সময় (গড়) 27.1s
#42	GLM 5 medium	Z.ai	1	6.1	$0.307	0/1	14.7s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.307 প্রতিক্রিয়া সময় (গড়) 14.7s
#45	DeepSeek V4 Flash high	DeepSeek	1	6.1	$0.042	0/1	25.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.042 প্রতিক্রিয়া সময় (গড়) 25.2s
#47	MiniMax M3 medium	Minimax	1	5.1	$0.286	0/1	33.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 33.3s
#53	GPT-5.4 Nano medium	OpenAI	1	4.5	$0.138	0/1	4.15s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 4.15s
#54	GPT-5.3 Chat none	OpenAI	1	4.6	$0.571	0/1	1.99s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 1.99s

1 2 3 4 5 6

→

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

Sadharon Buddhimotta: নির্দেশনা অনুসরণ করা হয়নি

মডেল ফিল্টার করুন

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা অনুযায়ী শীর্ষ মডেল

নির্দেশনা অনুসরণ করা হয়নি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল