إخفاقات الفئات في AI BENCHY
الذكاء العام
إجابة خاطئة
الذكاء العام
إجابة خاطئة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور إجابة خاطئة في الذكاء العام، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↑.
أسباب الإخفاق المرتبطة
| الترتيب | النموذج | الشركة | عدد إجابة خاطئة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #29 | Qwen3.5 Plus 2026-02-15 none | Qwen | 1 | 4.0 | 0/1 | 2.26s |
| #38 | Gemini 2.5 Flash none | 1 | 5.0 | 0/1 | 615ms | |
| #44 | GPT-5.4 none | OpenAI | 1 | 3.0 | 0/1 | 1.78s |
| #47 | GPT-4o-mini none | OpenAI | 1 | 3.0 | 0/1 | 909ms |
| #49 | GLM 4.7 Flash none | Z.ai | 1 | 3.0 | 0/1 | 1.59s |
| #52 | GLM 4.7 Flash medium | Z.ai | 1 | 10.0 | 0/1 | 18.1s |