إخفاقات الفئات في AI BENCHY
استدعاء الأدوات: لا توجد إجابة
استدعاء الأدوات
لا توجد إجابة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لا توجد إجابة في استدعاء الأدوات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: عدد الإخفاقات ↑.
| الترتيب | النموذج | الشركة | عدد لا توجد إجابة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #40 | GPT-5.2 medium | OpenAI | 1 | 4.7 | 0/1 | 10.3s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 2.8 | 0/1 | 27.7s |