ترتيب استدعاء الأدوات x لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لا توجد إجابة في استدعاء الأدوات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

أسباب الفشل

خطأ API17 استدعاء أداة غير صالح9 لم يتبع التعليمات8 إجابة خاطئة3 لا توجد إجابة2

الفئات

مجمّع29 البرمجة18 معلومات عامة13 تحليل البيانات واستخراجها8 خاص بالمجال8 حيل مضادة للذكاء الاصطناعي4 حل الألغاز3 اتباع التعليمات2 استدعاء الأدوات2

2/2

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	درجة الفئة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#21	GPT-5.2 medium	OpenAI	1	4.7	$0.951	0/1	10.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 10.3s
#185	Grok 4.1 Fast medium	X AI	1	2.8	$0.069	0/1	27.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.069 زمن الاستجابة (المتوسط) 27.7s

تصفية النماذج