অ্যান্টি-এআই কৌশল x ভুল উত্তর র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর ভুল উত্তর হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

মোট ব্যর্থতা

293

সবচেয়ে বেশি প্রভাবিত মডেল

Seed-2.0-Mini 1

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

ডোমেইন-নির্দিষ্ট412 অ্যান্টি-এআই কৌশল293 কোডিং252 ধাঁধা সমাধান201 সাধারণ জ্ঞান168 সমন্বিত68 নির্দেশনা অনুসরণ61 Sadharon Buddhimotta59 ডেটা পার্সিং ও নিষ্কাশন41 টুল কলিং3

140/140

র‍্যাঙ্ক	মডেল	কোম্পানি	ভুল উত্তর সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#80	Seed-2.0-Mini medium	Bytedance Seed	1	6.6	$0.101	2/4	74.7s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.101 প্রতিক্রিয়া সময় (গড়) 74.7s
#77	Kimi K2.5 medium	Moonshot AI	1	7.3	$0.600	2/4	51.4s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.600 প্রতিক্রিয়া সময় (গড়) 51.4s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	8.2	$0.437	3/4	45.8s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.437 প্রতিক্রিয়া সময় (গড়) 45.8s
#102	Laguna XS 2.1 medium	Poolside	2	4.8	$0.068	1/4	42.0s
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.068 প্রতিক্রিয়া সময় (গড়) 42.0s
#172	MiniMax M2.7 medium	Minimax	1	7.9	$0.163	2/4	40.3s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.163 প্রতিক্রিয়া সময় (গড়) 40.3s
#143	Gemini 3.1 Flash Lite high	Google	1	8.7	$2.044	3/4	37.2s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 37.2s
#204	Qwen3.5-9B medium	Qwen	1	5.1	$0.036	1/4	34.4s
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 34.4s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	2/4	32.8s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 32.8s
#45	DeepSeek V4 Flash high	DeepSeek	1	8.3	$0.042	3/4	28.5s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.042 প্রতিক্রিয়া সময় (গড়) 28.5s
#46	DeepSeek V4 Pro high	DeepSeek	2	5.7	$0.200	1/4	25.7s
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.200 প্রতিক্রিয়া সময় (গড়) 25.7s
#128	GPT-5 Nano medium	OpenAI	2	6.5	$0.114	2/4	25.5s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.114 প্রতিক্রিয়া সময় (গড়) 25.5s
#171	North Mini Code none	Cohere	2	3.0	$0.000	0/4	22.5s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 22.5s
#150	DeepSeek V4 Flash none	DeepSeek	4	3.0	$0.044	0/4	20.2s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.044 প্রতিক্রিয়া সময় (গড়) 20.2s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	8.3	$0.234	3/4	18.0s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.234 প্রতিক্রিয়া সময় (গড়) 18.0s
#194	GLM 4.7 Flash medium	Z.ai	2	4.7	$0.166	1/4	15.0s
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.166 প্রতিক্রিয়া সময় (গড়) 15.0s

1 2 10

→

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: ভুল উত্তর

মডেল ফিল্টার করুন

ভুল উত্তর সংখ্যা অনুযায়ী শীর্ষ মডেল

ভুল উত্তর সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল