Eșecuri pe categorii AI BENCHY
Respectarea instrucțiunilor: Eroare API
Respectarea instrucțiunilor
Eroare API
Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Respectarea instrucțiunilor, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Eroare API | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |