AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

إخفاقات الفئات في AI BENCHY

استدعاء الأدوات
لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لا توجد إجابة في استدعاء الأدوات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

2

إجمالي الإخفاقات

2

النموذج الأكثر تأثرًا

GPT-5.2 1

أسباب الإخفاق المرتبطة

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل متوسط الدرجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية