AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

إخفاقات الفئات في AI BENCHY

الذكاء العام
إجابة خاطئة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور إجابة خاطئة في الذكاء العام، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

6

إجمالي الإخفاقات

6

النموذج الأكثر تأثرًا

Gemini 2.5 Flash 1
الترتيب النموذج الشركة عدد إجابة خاطئة درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#38 Gemini 2.5 Flash none Google 1 5.0 0/1 615ms
#47 GPT-4o-mini none OpenAI 1 3.0 0/1 909ms
#49 GLM 4.7 Flash none Z.ai 1 3.0 0/1 1.59s
#44 GPT-5.4 none OpenAI 1 3.0 0/1 1.78s
#29 Qwen3.5 Plus 2026-02-15 none Qwen 1 4.0 0/1 2.26s
#52 GLM 4.7 Flash medium Z.ai 1 10.0 0/1 18.1s

أفضل النماذج حسب عدد إجابة خاطئة

عدد إجابة خاطئة مقابل متوسط الدرجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية