Eșecuri pe categorii AI BENCHY
Respectarea instrucțiunilor: Formatare suplimentară
Respectarea instrucțiunilor
Formatare suplimentară
Vezi ce modele AI au cele mai mari șanse să întâmpine Formatare suplimentară la Respectarea instrucțiunilor, ca să găsești mai repede punctele slabe. Sortează după: Cost total ↑.
Motive de eșec
2/2
Filtrează modelele
Niciun model nu corespunde căutării și filtrelor curente.
| Rang | Model | Companie | Număr de Formatare suplimentară | Scor de categorie | Cost total | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|---|
| #158 | Hy3 preview none | Tencent | 1 | 6.3 | $0.003 | 1/2 | 13.0s |
| #117 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | $0.007 | 1/2 | 17.5s |