Eșecuri pe categorii AI BENCHY
Programare: Nu a urmat instrucțiunile
Programare
Nu a urmat instrucțiunile
Vezi ce modele AI au cele mai mari șanse să întâmpine Nu a urmat instrucțiunile la Programare, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↓.
Motive de eșec
| Rang | Model | Companie | Număr de Nu a urmat instrucțiunile | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #91 | Qwen3.5-9B medium | Qwen | 1 | 2.6 | 0/1 | 135.6s |
| #49 | Grok 4.1 Fast medium | X AI | 1 | 2.3 | 0/1 | 23.6s |