AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

إخفاقات AI BENCHY

إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: متوسط الدرجة ↓.

النماذج المعروضة

5

إجمالي الإخفاقات

8

النموذج الأكثر تأثرًا

MiMo-V2-Flash 1
الترتيب النموذج الشركة عدد خطأ API متوسط الدرجة اختبارات صحيحة زمن الاستجابة (المتوسط)
#21 MiMo-V2-Flash medium Xiaomi 1 7.2 11/16 25.3s
#24 Qwen3.5-Flash medium Qwen 1 6.9 10/16 70.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s
#55 LFM2-24B-A2B none Liquid 4 2.6 1/16 811ms

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل متوسط الدرجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)