إخفاقات الفئات في AI BENCHY
اتباع التعليمات: انتهت المهلة
اتباع التعليمات
انتهت المهلة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور انتهت المهلة في اتباع التعليمات، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: عدد الإخفاقات ↑.
أسباب الفشل
| الترتيب | النموذج | الشركة | عدد انتهت المهلة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |