টুল কলিং x API ত্রুটি র‌্যাঙ্কিং

দেখুন টুল কলিং এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

Hy3 preview 1

ব্যর্থতার কারণ

API ত্রুটি17 অবৈধ টুল কল9 নির্দেশনা অনুসরণ করা হয়নি8 ভুল উত্তর3 কোন উত্তর নেই2

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

17/17

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#159	Hy3 preview low	Tencent	1	2.8	$0.015	0/1	17.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 17.8s
#37	Kimi K3 max	Moonshot AI	1	3.0	$3.112	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $3.112 প্রতিক্রিয়া সময় (গড়) 0ms
#56	Kimi K2.7 Code medium	Moonshot AI	1	3.0	$0.740	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 0ms
#78	GLM 5.1 medium	Z.ai	1	3.0	$0.535	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.535 প্রতিক্রিয়া সময় (গড়) 0ms
#83	Gemini 3.5 Flash none	Google	1	3.0	$1.079	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 0ms
#94	Qwen3.6 35B A3B medium	Qwen	1	3.0	$0.746	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 0ms
#116	Gemma 4 31B medium	Google	1	3.0	$0.107	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.107 প্রতিক্রিয়া সময় (গড়) 0ms
#121	Gemma 4 31B none	Google	1	3.0	$0.021	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 0ms
#167	Qwen3.6 35B A3B none	Qwen	1	3.0	$0.061	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.061 প্রতিক্রিয়া সময় (গড়) 0ms
#185	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 0ms
#187	Grok 4.20 Multi Agent Beta medium	X AI	1	3.0	$5.599	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $5.599 প্রতিক্রিয়া সময় (গড়) 0ms
#208	Grok Build 0.1 none	X AI	1	3.0	$0.547	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.547 প্রতিক্রিয়া সময় (গড়) 0ms
#212	gpt-oss-120b none	OpenAI	1	3.0	$0.010	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 0ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

টুল কলিং: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল