Eșecuri pe categorii AI BENCHY
Respectarea instrucțiunilor: Fără răspuns
Respectarea instrucțiunilor
Fără răspuns
Vezi ce modele AI au cele mai mari șanse să întâmpine Fără răspuns la Respectarea instrucțiunilor, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.
Motive de eșec
| Rang | Model | Companie | Număr de Fără răspuns | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #161 | Qwen3.5-9B medium | Qwen | 1 | 6.5 | 1/2 | 5.75s |
| #53 | Gemini 3.1 Flash Lite high | 1 | 7.3 | 1/2 | 23.3s |