অ্যান্টি-এআই কৌশল x ভুল উত্তর র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর ভুল উত্তর হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়।

দেখানো মডেল

মোট ব্যর্থতা

293

সবচেয়ে বেশি প্রভাবিত মডেল

Seed-2.0-Lite 4

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

ডোমেইন-নির্দিষ্ট421 অ্যান্টি-এআই কৌশল293 কোডিং259 ধাঁধা সমাধান204 সাধারণ জ্ঞান172 সমন্বিত69 Sadharon Buddhimotta62 নির্দেশনা অনুসরণ61 ডেটা পার্সিং ও নিষ্কাশন41 টুল কলিং3

140/140

র‍্যাঙ্ক	মডেল	কোম্পানি	ভুল উত্তর সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#44	Claude Sonnet 4.6 medium	Anthropic	1	6.5	$2.057	2/4	2.98s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $2.057 প্রতিক্রিয়া সময় (গড়) 2.98s
#48	GPT-5.6 Luna high	OpenAI	1	8.3	$1.017	3/4	2.99s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $1.017 প্রতিক্রিয়া সময় (গড়) 2.99s
#49	DeepSeek V4 Flash high	DeepSeek	1	8.3	$0.041	3/4	28.5s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 28.5s
#54	GPT-5.6 Luna medium	OpenAI	1	8.3	$0.352	3/4	2.52s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.352 প্রতিক্রিয়া সময় (গড়) 2.52s
#57	GPT-5.4 Nano medium	OpenAI	1	8.3	$0.138	3/4	4.52s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.138 প্রতিক্রিয়া সময় (গড়) 4.52s
#58	GPT-5.3 Chat none	OpenAI	1	6.7	$0.571	2/4	3.86s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 3.86s
#59	GPT-5.6 Terra low	OpenAI	1	8.3	$0.519	3/4	2.36s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.519 প্রতিক্রিয়া সময় (গড়) 2.36s
#60	GPT-5.4 Mini medium	OpenAI	1	8.6	$0.756	3/4	4.05s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.756 প্রতিক্রিয়া সময় (গড়) 4.05s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	8.2	$0.437	3/4	45.8s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.437 প্রতিক্রিয়া সময় (গড়) 45.8s
#67	Claude Sonnet 4.6 none	Anthropic	1	4.8	$0.661	1/4	2.94s
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.661 প্রতিক্রিয়া সময় (গড়) 2.94s
#71	Step 3.7 Flash low	Stepfun	1	8.7	$0.454	3/4	4.02s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.454 প্রতিক্রিয়া সময় (গড়) 4.02s
#72	Kimi K2.6 medium	Moonshot AI	1	7.0	$1.036	2/4	11.6s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $1.036 প্রতিক্রিয়া সময় (গড়) 11.6s
#79	Grok 4.20 medium	X AI	1	8.2	$0.777	3/4	3.95s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.777 প্রতিক্রিয়া সময় (গড়) 3.95s
#81	Kimi K2.5 medium	Moonshot AI	1	7.3	$0.600	2/4	51.4s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.600 প্রতিক্রিয়া সময় (গড়) 51.4s
#82	Mercury 2 medium	Inception	1	6.9	$0.093	2/4	1.12s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.093 প্রতিক্রিয়া সময় (গড়) 1.12s

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: ভুল উত্তর

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল