AI BENCHY
Your ad here

إخفاقات الفئات في AI BENCHY

حل الألغاز: انتهت المهلة

حل الألغاز
انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور انتهت المهلة في حل الألغاز، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

4

إجمالي الإخفاقات

6

النموذج الأكثر تأثرًا

Qwen3.5-Flash 2
الترتيب النموذج الشركة عدد انتهت المهلة درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#32 Qwen3.5-Flash medium Qwen 2 6.4 1/3 56.7s
#97 Qwen3.5-9B medium Qwen 2 3.1 0/3 33.4s
#43 Qwen3.5-35B-A3B medium Qwen 1 6.4 1/3 31.6s
#71 MiniMax M2.5 medium Minimax 1 5.3 1/3 11.5s

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية