AI BENCHY
Advertise here

إخفاقات الفئات في AI BENCHY

خاص بالمجال: لم يتبع التعليمات

خاص بالمجال
لم يتبع التعليمات

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لم يتبع التعليمات في خاص بالمجال، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: عدد الإخفاقات ↑.

النماذج المعروضة

1

إجمالي الإخفاقات

1

النموذج الأكثر تأثرًا

Grok Build 0.1 1

أفضل النماذج حسب عدد لم يتبع التعليمات

عدد لم يتبع التعليمات مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية