অ্যান্টি-এআই কৌশল x API ত্রুটি র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

DeepSeek V3.2 1

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

13/13

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#76	DeepSeek V3.2 medium	DeepSeek	1	8.2	$0.078	3/4	24.2s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 24.2s
#135	Hy3 preview high	Tencent	2	6.4	$0.048	2/4	15.1s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 15.1s
#175	Qwen3.6 Plus Preview medium	Qwen	1	8.3	$0.000	3/4	11.7s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 11.7s
#173	DeepSeek V3.2 none	DeepSeek	1	3.2	$0.054	0/4	9.35s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.054 প্রতিক্রিয়া সময় (গড়) 9.35s
#153	Hy3 preview low	Tencent	1	8.3	$0.015	3/4	9.32s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 9.32s
#32	Inkling medium	Thinkingmachines	1	8.7	$0.391	3/4	6.49s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.391 প্রতিক্রিয়া সময় (গড়) 6.49s
#186	Laguna M.1 medium	Poolside	1	6.5	$0.033	2/4	4.87s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 4.87s
#198	Laguna Xs.2 medium	Poolside	1	6.9	$0.015	2/4	2.68s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 2.68s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.9	$0.077	2/4	2.49s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 2.49s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	6.4	$0.000	2/4	1.20s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 1.20s
#192	Laguna M.1 none	Poolside	1	3.4	$0.009	0/4	705ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.009 প্রতিক্রিয়া সময় (গড়) 705ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	4.8	$0.000	1/4	584ms
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 584ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/4	534ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 534ms

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল