AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

إخفاقات الفئات في AI BENCHY

الذكاء العام
إجابة خاطئة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور إجابة خاطئة في الذكاء العام، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

6

إجمالي الإخفاقات

6

النموذج الأكثر تأثرًا

Qwen3.5 Plus 2026-02-15 1
الترتيب النموذج الشركة عدد إجابة خاطئة درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#29 Qwen3.5 Plus 2026-02-15 none Qwen 1 4.0 0/1 2.26s
#38 Gemini 2.5 Flash none Google 1 5.0 0/1 615ms
#44 GPT-5.4 none OpenAI 1 3.0 0/1 1.78s
#47 GPT-4o-mini none OpenAI 1 3.0 0/1 909ms
#49 GLM 4.7 Flash none Z.ai 1 3.0 0/1 1.59s
#52 GLM 4.7 Flash medium Z.ai 1 10.0 0/1 18.1s

أفضل النماذج حسب عدد إجابة خاطئة

عدد إجابة خاطئة مقابل متوسط الدرجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية