AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY বিভাগীয় ব্যর্থতা

ডেটা পার্সিং ও নিষ্কাশন: API ত্রুটি

ডেটা পার্সিং ও নিষ্কাশন
API ত্রুটি

দেখুন ডেটা পার্সিং ও নিষ্কাশন এ কোন AI মডেলগুলোর API ত্রুটি হওয়ার সম্ভাবনা সবচেয়ে বেশি, যাতে দুর্বল দিক দ্রুত ধরা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

6

মোট ব্যর্থতা

6

সবচেয়ে বেশি প্রভাবিত মডেল

Qwen3.5-35B-A3B 1
র‍্যাঙ্ক মডেল কোম্পানি API ত্রুটি সংখ্যা বিভাগ স্কোর সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)
#43 Qwen3.5-35B-A3B medium Qwen 1 7.3 1/2 59.3s
#32 Qwen3.5-Flash medium Qwen 1 7.3 1/2 57.0s
#94 MiMo-V2-Flash none Xiaomi 1 2.9 0/2 19.7s
#84 gpt-oss-120b none OpenAI 1 6.5 1/2 7.12s
#73 Mistral Small 4 medium Mistral 1 7.3 1/2 1.23s
#41 MiMo-V2-Flash medium Xiaomi 1 6.5 1/2 0ms

API ত্রুটি সংখ্যা অনুযায়ী শীর্ষ মডেল

API ত্রুটি সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল

আনুমানিক অপচয় হওয়া খরচ অনুযায়ী শীর্ষ মডেল