إخفاقات AI BENCHY
إخفاقات انتهت المهلة
اكتشف أي نماذج الذكاء الاصطناعي تواجه انتهت المهلة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: النتيجة ↑.
| الترتيب | النموذج | الشركة | عدد انتهت المهلة | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #23 | GLM 5 Turbo medium | Z.ai | 1 | 8.0 | 14/21 | 23.0s |
| #18 | Qwen3.7 Plus medium | Qwen | 1 | 8.2 | 15/21 | 38.9s |
| #17 | GLM 5 medium | Z.ai | 1 | 8.3 | 15/21 | 33.5s |
| #11 | Claude Opus 4.7 medium | Anthropic | 1 | 8.7 | 17/21 | 4.73s |