AI BENCHY
Your ad here

إخفاقات الفئات في AI BENCHY

مجمّع: لم يتبع التعليمات

مجمّع
لم يتبع التعليمات

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لم يتبع التعليمات في مجمّع، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

1

إجمالي الإخفاقات

1

النموذج الأكثر تأثرًا

MiMo-V2.5-Pro 1

أفضل النماذج حسب عدد لم يتبع التعليمات

عدد لم يتبع التعليمات مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية