إخفاقات الفئات في AI BENCHY
حل الألغاز: انتهت المهلة
حل الألغاز
انتهت المهلة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور انتهت المهلة في حل الألغاز، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.
| الترتيب | النموذج | الشركة | عدد انتهت المهلة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #32 | Qwen3.5-Flash medium | Qwen | 2 | 6.4 | 1/3 | 56.7s |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 6.4 | 1/3 | 31.6s |
| #71 | MiniMax M2.5 medium | Minimax | 1 | 5.3 | 1/3 | 11.5s |
| #97 | Qwen3.5-9B medium | Qwen | 2 | 3.1 | 0/3 | 33.4s |