অ্যান্টি-এআই কৌশল x API ত্রুটি র‌্যাঙ্কিং

দেখুন অ্যান্টি-এআই কৌশল এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়।

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

ব্যর্থতার কারণ

ভুল উত্তর293 নির্দেশনা অনুসরণ করা হয়নি33 অতিরিক্ত ফরম্যাটিং20 API ত্রুটি14 কোন উত্তর নেই4 টাইমআউট4

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

13/13

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#135	Hy3 preview high	Tencent	2	6.4	$0.048	2/4	15.1s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 15.1s
#32	Inkling medium	Thinkingmachines	1	8.7	$0.391	3/4	6.49s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.391 প্রতিক্রিয়া সময় (গড়) 6.49s
#76	DeepSeek V3.2 medium	DeepSeek	1	8.2	$0.078	3/4	24.2s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 24.2s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.9	$0.077	2/4	2.49s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 2.49s
#153	Hy3 preview low	Tencent	1	8.3	$0.015	3/4	9.32s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 9.32s
#173	DeepSeek V3.2 none	DeepSeek	1	3.2	$0.054	0/4	9.35s
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.054 প্রতিক্রিয়া সময় (গড়) 9.35s
#175	Qwen3.6 Plus Preview medium	Qwen	1	8.3	$0.000	3/4	11.7s
মোট টেস্ট 4 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 11.7s
#186	Laguna M.1 medium	Poolside	1	6.5	$0.033	2/4	4.87s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 4.87s
#192	Laguna M.1 none	Poolside	1	3.4	$0.009	0/4	705ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.009 প্রতিক্রিয়া সময় (গড়) 705ms
#198	Laguna Xs.2 medium	Poolside	1	6.9	$0.015	2/4	2.68s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 2.68s
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/4	534ms
মোট টেস্ট 4 ভুল টেস্ট 4 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 534ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	6.4	$0.000	2/4	1.20s
মোট টেস্ট 4 ভুল টেস্ট 2 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 1.20s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	4.8	$0.000	1/4	584ms
মোট টেস্ট 4 ভুল টেস্ট 3 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 584ms

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

অ্যান্টি-এআই কৌশল: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল