Eșecuri pe categorii AI BENCHY
Respectarea instrucțiunilor: Eroare API
Respectarea instrucțiunilor
Eroare API
Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Respectarea instrucțiunilor, ca să găsești mai repede punctele slabe.
Motive de eșec
| Rang | Model | Companie | Număr de Eroare API | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |