সমন্বিত x API ত্রুটি র‌্যাঙ্কিং

দেখুন সমন্বিত এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়।

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

ব্যর্থতার কারণ

অবৈধ টুল কল91 ভুল উত্তর68 কোন উত্তর নেই29 API ত্রুটি26 টাইমআউট5 অতিরিক্ত ফরম্যাটিং1 নির্দেশনা অনুসরণ করা হয়নি1

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

24/24

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#79	Gemini 3.5 Flash none	Google	2	3.0	$1.079	0/2	0ms
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 0ms
#179	Ring-2.6-1T none	Inclusionai	2	3.0	$0.026	0/2	0ms
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 0ms
#33	Kimi K3 max	Moonshot AI	1	6.5	$3.112	1/2	223.0s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $3.112 প্রতিক্রিয়া সময় (গড়) 223.0s
#60	LongCat 2.0 medium	Meituan	1	7.3	$0.478	1/2	151.0s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.478 প্রতিক্রিয়া সময় (গড়) 151.0s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	6.4	$0.387	1/2	111.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.387 প্রতিক্রিয়া সময় (গড়) 111.9s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.4	$0.467	1/2	135.7s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.467 প্রতিক্রিয়া সময় (গড়) 135.7s
#90	Qwen3.6 35B A3B medium	Qwen	1	3.0	$0.746	0/2	817.6s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 817.6s
#110	Gemma 4 31B medium	Google	1	2.9	$0.163	0/2	433.1s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.163 প্রতিক্রিয়া সময় (গড়) 433.1s
#115	Gemma 4 31B none	Google	1	3.8	$0.035	0/2	30.0s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.035 প্রতিক্রিয়া সময় (গড়) 30.0s
#129	Nemotron 3 Ultra none	NVIDIA	1	3.0	$0.095	0/2	21.1s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.095 প্রতিক্রিয়া সময় (গড়) 21.1s
#130	Step 3.5 Flash medium	Stepfun	1	6.5	$0.108	1/2	813.7s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.108 প্রতিক্রিয়া সময় (গড়) 813.7s
#140	Nemotron 3 Super medium	NVIDIA	1	6.4	$0.050	1/2	259.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.050 প্রতিক্রিয়া সময় (গড়) 259.9s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.5	$0.077	1/2	74.5s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.077 প্রতিক্রিয়া সময় (গড়) 74.5s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	6.5	$0.048	1/2	19.6s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 19.6s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	1	6.4	$0.041	1/2	55.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 55.9s

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

সমন্বিত: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল