إخفاقات الفئات في AI BENCHY
تحليل البيانات واستخراجها
خطأ API
تحليل البيانات واستخراجها
خطأ API
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور خطأ API في تحليل البيانات واستخراجها، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.
أسباب الإخفاق المرتبطة
الفئات المرتبطة
| الترتيب | النموذج | الشركة | عدد خطأ API | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 1/2 | 59.3s |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 5.5 | 1/2 | 57.0s |
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 5.5 | 1/2 | 0ms |