Eșecuri pe categorii AI BENCHY
Respectarea instrucțiunilor: Timp expirat
Respectarea instrucțiunilor
Timp expirat
Vezi ce modele AI au cele mai mari șanse să întâmpine Timp expirat la Respectarea instrucțiunilor, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Timp expirat | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #97 | Qwen3.5-9B medium | Qwen | 1 | 6.4 | 1/2 | 17.1s |