ডেটা পার্সিং ও নিষ্কাশন x API ত্রুটি র‌্যাঙ্কিং

দেখুন ডেটা পার্সিং ও নিষ্কাশন এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

মোট ব্যর্থতা

সবচেয়ে বেশি প্রভাবিত মডেল

MiMo-V2-Flash 1

ব্যর্থতার কারণ

ভুল উত্তর41 API ত্রুটি14 কোন উত্তর নেই8 অতিরিক্ত ফরম্যাটিং6 টাইমআউট1

বিভাগ

কোডিং45 সমন্বিত26 টুল কলিং17 অ্যান্টি-এআই কৌশল14 ডেটা পার্সিং ও নিষ্কাশন14 সাধারণ জ্ঞান13 Sadharon Buddhimotta12 ধাঁধা সমাধান12 ডোমেইন-নির্দিষ্ট7 নির্দেশনা অনুসরণ1

14/14

র‍্যাঙ্ক	মডেল	কোম্পানি	API ত্রুটি সংখ্যা	বিভাগ স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 0ms
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.020 প্রতিক্রিয়া সময় (গড়) 0ms
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 1.23s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.003 প্রতিক্রিয়া সময় (গড়) 2.85s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.018 প্রতিক্রিয়া সময় (গড়) 5.25s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 5.85s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 7.12s
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 8.10s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.547 প্রতিক্রিয়া সময় (গড়) 9.33s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 12.1s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.025 প্রতিক্রিয়া সময় (গড়) 19.7s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 45.9s
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.139 প্রতিক্রিয়া সময় (গড়) 57.0s
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.837 প্রতিক্রিয়া সময় (গড়) 59.3s

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল

ডেটা পার্সিং ও নিষ্কাশন: API ত্রুটি

মডেল ফিল্টার করুন

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল