إخفاقات الفئات في AI BENCHY
استدعاء الأدوات
لا توجد إجابة
استدعاء الأدوات
لا توجد إجابة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لا توجد إجابة في استدعاء الأدوات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.
أسباب الإخفاق المرتبطة
| الترتيب | النموذج | الشركة | عدد لا توجد إجابة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #27 | GPT-5.2 medium | OpenAI | 1 | 10.0 | 0/1 | 10.3s |
| #30 | Grok 4.1 Fast medium | X AI | 1 | 10.0 | 0/1 | 27.7s |