Eșecuri pe categorii AI BENCHY
Inteligență generală: Răspuns greșit
Inteligență generală
Răspuns greșit
Vezi ce modele AI au cele mai mari șanse să întâmpine Răspuns greșit la Inteligență generală, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Răspuns greșit | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #62 | Gemini 2.5 Flash none | 1 | 5.0 | 0/1 | 615ms | |
| #82 | Grok 4.20 none | X AI | 1 | 4.8 | 0/1 | 659ms |
| #83 | Mistral Small 4 none | Mistral | 1 | 4.0 | 0/1 | 729ms |
| #75 | GLM 5.1 none | Z.ai | 1 | 5.0 | 0/1 | 790ms |
| #89 | GPT-4o-mini none | OpenAI | 1 | 4.0 | 0/1 | 909ms |
| #74 | GLM 4.7 Flash none | Z.ai | 1 | 4.0 | 0/1 | 1.59s |
| #66 | GPT-5.4 none | OpenAI | 1 | 4.4 | 0/1 | 1.78s |
| #49 | Qwen3.5 Plus 2026-02-15 none | Qwen | 1 | 4.4 | 0/1 | 2.26s |
| #18 | GLM 5 Turbo medium | Z.ai | 1 | 6.1 | 0/1 | 10.1s |
| #93 | GLM 4.7 Flash medium | Z.ai | 1 | 3.6 | 0/1 | 18.1s |