AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

إخفاقات الفئات في AI BENCHY

اتباع التعليمات: تنسيق إضافي

اتباع التعليمات
تنسيق إضافي

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور تنسيق إضافي في اتباع التعليمات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: إجمالي التكلفة ↓.

النماذج المعروضة

2

إجمالي الإخفاقات

2

النموذج الأكثر تأثرًا

DeepSeek V4 Flash 1
2/2
الترتيب النموذج الشركة عدد تنسيق إضافي درجة الفئة إجمالي التكلفة اختبارات صحيحة زمن الاستجابة (المتوسط)

أفضل النماذج حسب عدد تنسيق إضافي

عدد تنسيق إضافي مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية