অ্যান্টি-এআই কৌশল x ভুল উত্তর র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর ভুল উত্তর হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়।

দেখানো মডেল

মোট ব্যর্থতা

293

সবচেয়ে বেশি প্রভাবিত মডেল

Seed-2.0-Lite 4

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

ডোমেইন-নির্দিষ্ট412 অ্যান্টি-এআই কৌশল293 কোডিং252 ধাঁধা সমাধান201 সাধারণ জ্ঞান168 সমন্বিত68 নির্দেশনা অনুসরণ61 Sadharon Buddhimotta59 ডেটা পার্সিং ও নিষ্কাশন41 টুল কলিং3

140/140

র‍্যাঙ্ক	মডেল	কোম্পানি	ভুল উত্তর সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#116	Seed-2.0-Lite none	Bytedance Seed	4	3.0	$0.066	0/4	2.43s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.066 প্রতিক্রিয়া সময় (গড়) 2.43s
#118	Gemini 2.5 Flash none	Google	4	3.0	$0.017	0/4	582ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.017 প্রতিক্রিয়া সময় (গড়) 582ms
#124	Qwen3.6 Flash none	Qwen	4	3.1	$0.062	0/4	1.63s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.062 প্রতিক্রিয়া সময় (গড়) 1.63s
#125	Qwen3.5-Flash none	Qwen	4	3.5	$0.073	0/4	1.32s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 1.32s
#127	Qwen3.5-35B-A3B none	Qwen	4	3.4	$0.106	0/4	1.43s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.106 প্রতিক্রিয়া সময় (গড়) 1.43s
#129	Nemotron 3 Ultra none	NVIDIA	4	3.5	$0.095	0/4	2.35s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 2.35s
#136	GPT-5.4 Mini none	OpenAI	4	3.1	$0.095	0/4	929ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 929ms
#139	GPT-5.4 none	OpenAI	4	3.2	$0.397	0/4	1.21s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.397 প্রতিক্রিয়া সময় (গড়) 1.21s
#147	Mimo V2 PRO none	Xiaomi	4	3.5	$0.045	0/4	1.80s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.045 প্রতিক্রিয়া সময় (গড়) 1.80s
#150	DeepSeek V4 Flash none	DeepSeek	4	3.0	$0.044	0/4	20.2s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.044 প্রতিক্রিয়া সময় (গড়) 20.2s
#151	GLM 5.1 none	Z.ai	4	4.0	$0.164	0/4	2.11s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.164 প্রতিক্রিয়া সময় (গড়) 2.11s
#152	Qwen3.6 27B none	Qwen	4	3.8	$0.087	0/4	2.83s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.087 প্রতিক্রিয়া সময় (গড়) 2.83s
#155	Kimi K2.5 none	Moonshot AI	4	3.6	$0.127	0/4	6.24s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.127 প্রতিক্রিয়া সময় (গড়) 6.24s
#161	Qwen3.6 35B A3B none	Qwen	4	3.6	$0.061	0/4	2.10s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.061 প্রতিক্রিয়া সময় (গড়) 2.10s
#162	Ling-2.6-1T none	Inclusionai	4	3.4	$0.016	0/4	6.55s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.016 প্রতিক্রিয়া সময় (গড়) 6.55s

1 2 10

→

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: ভুল উত্তর

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল