إخفاقات الفئات في AI BENCHY
الذكاء العام
إجابة خاطئة
الذكاء العام
إجابة خاطئة
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور إجابة خاطئة في الذكاء العام، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.
أسباب الإخفاق المرتبطة
| الترتيب | النموذج | الشركة | عدد إجابة خاطئة | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #38 | Gemini 2.5 Flash none | 1 | 5.0 | 0/1 | 615ms | |
| #47 | GPT-4o-mini none | OpenAI | 1 | 3.0 | 0/1 | 909ms |
| #49 | GLM 4.7 Flash none | Z.ai | 1 | 3.0 | 0/1 | 1.59s |
| #44 | GPT-5.4 none | OpenAI | 1 | 3.0 | 0/1 | 1.78s |
| #29 | Qwen3.5 Plus 2026-02-15 none | Qwen | 1 | 4.0 | 0/1 | 2.26s |
| #52 | GLM 4.7 Flash medium | Z.ai | 1 | 10.0 | 0/1 | 18.1s |