AI BENCHY
Advertise here

إخفاقات الفئات في AI BENCHY

اتباع التعليمات: تنسيق إضافي

اتباع التعليمات
تنسيق إضافي

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور تنسيق إضافي في اتباع التعليمات، حتى ترصد نقاط الضعف بسرعة أكبر.

النماذج المعروضة

2

إجمالي الإخفاقات

2

النموذج الأكثر تأثرًا

DeepSeek V4 Flash 1
2/2
الترتيب النموذج الشركة عدد تنسيق إضافي درجة الفئة إجمالي التكلفة اختبارات صحيحة زمن الاستجابة (المتوسط)

أفضل النماذج حسب عدد تنسيق إضافي

عدد تنسيق إضافي مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية