AI BENCHY
Advertise here

Eșecuri pe categorii AI BENCHY

Rezolvare de puzzle-uri: Formatare suplimentară

Rezolvare de puzzle-uri
Formatare suplimentară

Vezi ce modele AI au cele mai mari șanse să întâmpine Formatare suplimentară la Rezolvare de puzzle-uri, ca să găsești mai repede punctele slabe.

Modele afișate

5

Eșecuri totale

5

Modelul cel mai afectat

Mimo V2 PRO 1
Rang Model Companie Număr de Formatare suplimentară Scor de categorie Teste corecte Timp de răspuns (mediu)
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s

Top modele după Număr de Formatare suplimentară

Număr de Formatare suplimentară vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat