إخفاقات الفئات في AI BENCHY
مجمّع: لم يتبع التعليمات
مجمّع
لم يتبع التعليمات
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لم يتبع التعليمات في مجمّع، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: إجمالي التكلفة ↑.
أسباب الفشل
1/1
تصفية النماذج
لا توجد نماذج تطابق البحث والفلاتر الحالية.
| الترتيب | النموذج | الشركة | عدد لم يتبع التعليمات | درجة الفئة | إجمالي التكلفة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|---|
| #119 | MiMo-V2.5-Pro none | Xiaomi | 1 | 3.0 | $0.017 | 0/1 | 3.54s |