إخفاقات الفئات في AI BENCHY
خاص بالمجال: خطأ API
خاص بالمجال
خطأ API
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور خطأ API في خاص بالمجال، حتى ترصد نقاط الضعف بسرعة أكبر.
أسباب الفشل
| الترتيب | النموذج | الشركة | عدد خطأ API | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #73 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #98 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |