AI BENCHY
Your ad here

إخفاقات الفئات في AI BENCHY

اتباع التعليمات: خطأ API

اتباع التعليمات
خطأ API

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور خطأ API في اتباع التعليمات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

1

إجمالي الإخفاقات

1

النموذج الأكثر تأثرًا

Grok 4.20 1

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية