অ্যান্টি-এআই কৌশল x ভুল উত্তর র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর ভুল উত্তর হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়।

দেখানো মডেল

মোট ব্যর্থতা

293

সবচেয়ে বেশি প্রভাবিত মডেল

Seed-2.0-Lite 4

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

ডোমেইন-নির্দিষ্ট421 অ্যান্টি-এআই কৌশল293 কোডিং259 ধাঁধা সমাধান204 সাধারণ জ্ঞান172 সমন্বিত69 Sadharon Buddhimotta62 নির্দেশনা অনুসরণ61 ডেটা পার্সিং ও নিষ্কাশন41 টুল কলিং3

140/140

র‍্যাঙ্ক	মডেল	কোম্পানি	ভুল উত্তর সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#211	Laguna Xs.2 none	Poolside	2	3.0	$0.004	0/4	534ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 534ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	2	4.8	$0.000	1/4	584ms
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 584ms
#5	GPT-5.6 Sol low	OpenAI	1	8.3	$0.971	3/4	2.60s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.971 প্রতিক্রিয়া সময় (গড়) 2.60s
#8	GPT-5.6 Sol high	OpenAI	1	8.7	$1.234	3/4	3.39s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $1.234 প্রতিক্রিয়া সময় (গড়) 3.39s
#16	GPT-5.3-Codex medium	OpenAI	1	8.7	$0.920	3/4	4.16s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 4.16s
#18	Claude Opus 4.7 medium	Anthropic	1	8.3	$1.477	3/4	1.85s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $1.477 প্রতিক্রিয়া সময় (গড়) 1.85s
#21	GPT-5.4 medium	OpenAI	1	8.3	$1.533	3/4	4.11s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $1.533 প্রতিক্রিয়া সময় (গড়) 4.11s
#24	GPT-5.2 medium	OpenAI	1	6.5	$0.951	2/4	7.81s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.951 প্রতিক্রিয়া সময় (গড়) 7.81s
#28	Gemini 2.5 Flash medium	Google	1	8.4	$0.643	3/4	6.30s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.643 প্রতিক্রিয়া সময় (গড়) 6.30s
#29	GPT-5 Mini medium	OpenAI	1	7.1	$0.237	2/4	13.9s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.237 প্রতিক্রিয়া সময় (গড়) 13.9s
#30	Muse Spark 1.1 high	Meta	1	7.5	$1.694	2/4	8.60s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 8.60s
#34	GPT-5.2 Chat none	OpenAI	1	8.7	$0.604	3/4	3.40s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.604 প্রতিক্রিয়া সময় (গড়) 3.40s
#38	GPT-5.6 Terra high	OpenAI	1	8.3	$1.055	3/4	2.54s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $1.055 প্রতিক্রিয়া সময় (গড়) 2.54s
#39	Seed-2.0-Lite medium	Bytedance Seed	1	8.3	$0.234	3/4	18.0s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.234 প্রতিক্রিয়া সময় (গড়) 18.0s
#43	GPT-5.6 Terra medium	OpenAI	1	8.3	$0.676	3/4	2.22s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.676 প্রতিক্রিয়া সময় (গড়) 2.22s

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: ভুল উত্তর

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল