সাধারণ জ্ঞান x API ত্রুটি র‌্যাঙ্কিং

দেখুন সাধারণ জ্ঞান এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

North Mini Code 1

ব্যর্থতার কারণ

ভুল উত্তর168 API ত্রুটি13 কোন উত্তর নেই13

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

13/13

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#137	North Mini Code medium	Cohere	1	3.0	$0.000	0/1	305.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 305.0s
#204	Qwen3.5-9B medium	Qwen	1	3.0	$0.036	0/1	177.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 177.0s
#133	Gemini 3 PRO Preview medium	Google	1	3.0	$0.385	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 0ms
#162	Ling-2.6-1T none	Inclusionai	1	3.0	$0.016	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.016 প্রতিক্রিয়া সময় (গড়) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.009 প্রতিক্রিয়া সময় (গড়) 0ms
#193	Elephant Alpha none	Openrouter	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#195	Elephant Alpha medium	Openrouter	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল