অ্যান্টি-এআই কৌশল x ভুল উত্তর র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর ভুল উত্তর হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

মোট ব্যর্থতা

293

সবচেয়ে বেশি প্রভাবিত মডেল

DeepSeek V4 Pro 2

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

ডোমেইন-নির্দিষ্ট412 অ্যান্টি-এআই কৌশল293 কোডিং252 ধাঁধা সমাধান201 সাধারণ জ্ঞান168 সমন্বিত68 নির্দেশনা অনুসরণ61 Sadharon Buddhimotta59 ডেটা পার্সিং ও নিষ্কাশন41 টুল কলিং3

140/140

র‍্যাঙ্ক	মডেল	কোম্পানি	ভুল উত্তর সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#82	DeepSeek V4 Pro none	DeepSeek	2	3.2	$0.096	0/4	4.02s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 4.02s
#116	Seed-2.0-Lite none	Bytedance Seed	4	3.0	$0.066	0/4	2.43s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.066 প্রতিক্রিয়া সময় (গড়) 2.43s
#118	Gemini 2.5 Flash none	Google	4	3.0	$0.017	0/4	582ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.017 প্রতিক্রিয়া সময় (গড়) 582ms
#124	Qwen3.6 Flash none	Qwen	4	3.1	$0.062	0/4	1.63s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.062 প্রতিক্রিয়া সময় (গড়) 1.63s
#125	Qwen3.5-Flash none	Qwen	4	3.5	$0.073	0/4	1.32s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 1.32s
#127	Qwen3.5-35B-A3B none	Qwen	4	3.4	$0.106	0/4	1.43s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.106 প্রতিক্রিয়া সময় (গড়) 1.43s
#129	Nemotron 3 Ultra none	NVIDIA	4	3.5	$0.095	0/4	2.35s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 2.35s
#136	GPT-5.4 Mini none	OpenAI	4	3.1	$0.095	0/4	929ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 929ms
#139	GPT-5.4 none	OpenAI	4	3.2	$0.397	0/4	1.21s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.397 প্রতিক্রিয়া সময় (গড়) 1.21s
#147	Mimo V2 PRO none	Xiaomi	4	3.5	$0.045	0/4	1.80s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.045 প্রতিক্রিয়া সময় (গড়) 1.80s
#148	Owl Alpha none	Openrouter	3	3.4	$0.000	0/4	2.78s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 2.78s
#150	DeepSeek V4 Flash none	DeepSeek	4	3.0	$0.044	0/4	20.2s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.044 প্রতিক্রিয়া সময় (গড়) 20.2s
#151	GLM 5.1 none	Z.ai	4	4.0	$0.164	0/4	2.11s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.164 প্রতিক্রিয়া সময় (গড়) 2.11s
#152	Qwen3.6 27B none	Qwen	4	3.8	$0.087	0/4	2.83s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.087 প্রতিক্রিয়া সময় (গড়) 2.83s
#154	MiMo-V2.5-Pro none	Xiaomi	3	3.3	$0.068	0/4	2.67s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.068 প্রতিক্রিয়া সময় (গড়) 2.67s

1 2 10

→

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: ভুল উত্তর

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল