Eșecuri pe categorii AI BENCHY
Specific domeniului: Nu a urmat instrucțiunile
Specific domeniului
Nu a urmat instrucțiunile
Vezi ce modele AI au cele mai mari șanse să întâmpine Nu a urmat instrucțiunile la Specific domeniului, ca să găsești mai repede punctele slabe. Sortează după: Număr de eșecuri ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Nu a urmat instrucțiunile | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #82 | Grok Build 0.1 none | X AI | 1 | 3.6 | 0/3 | 103.7s |