AI BENCHY
Your ad here

إخفاقات الفئات في AI BENCHY

حل الألغاز: إجابة خاطئة

حل الألغاز
إجابة خاطئة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور إجابة خاطئة في حل الألغاز، حتى ترصد نقاط الضعف بسرعة أكبر.

النماذج المعروضة

5

إجمالي الإخفاقات

85

النموذج الأكثر تأثرًا

Kimi K2.5 3
الترتيب النموذج الشركة عدد إجابة خاطئة درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#86 GPT-5.4 Mini none OpenAI 1 5.4 1/3 860ms
#88 Nemotron 3 Super none NVIDIA 1 5.7 1/3 7.50s
#90 Qwen3.5-9B none Qwen 1 3.2 0/3 683ms
#92 Qwen3 Coder Next medium Qwen 1 3.1 0/3 2.30s
#98 LFM2-24B-A2B none Liquid 1 4.4 0/3 1.69s

أفضل النماذج حسب عدد إجابة خاطئة

عدد إجابة خاطئة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية