Eșecuri pe categorii AI BENCHY
Rezolvare de puzzle-uri
Formatare suplimentară
Rezolvare de puzzle-uri
Formatare suplimentară
Vezi ce modele AI au cele mai mari șanse să întâmpine Formatare suplimentară la Rezolvare de puzzle-uri, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.
Motive de eșec asociate
| Rang | Model | Companie | Număr de Formatare suplimentară | Scor de categorie | Teste corecte | Timp de răspuns (mediu) |
|---|---|---|---|---|---|---|
| #25 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.0 | 2/3 | 2.92s |