AI BENCHY
Advertise here

Eșecuri pe categorii AI BENCHY

Combinat: Apel de instrument invalid

Combinat
Apel de instrument invalid

Vezi ce modele AI au cele mai mari șanse să întâmpine Apel de instrument invalid la Combinat, ca să găsești mai repede punctele slabe.

Modele afișate

4

Eșecuri totale

19

Modelul cel mai afectat

Gemini 3.5 Flash 1
Rang Model Companie Număr de Apel de instrument invalid Scor de categorie Teste corecte Timp de răspuns (mediu)
#145 Laguna M.1 none Poolside 1 3.0 0/1 4.32s
#154 Qwen3.5-9B none Qwen 1 3.0 0/1 5.91s
#158 GLM 4.7 Flash medium Z.ai 1 2.8 0/1 65.6s
#163 Granite 4.1 8B none IBM Granite 1 3.0 0/1 1.88s

Top modele după Număr de Apel de instrument invalid

Număr de Apel de instrument invalid vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat