AI BENCHY
Advertise here

Eșecuri pe categorii AI BENCHY

Specific domeniului: Răspuns greșit

Specific domeniului
Răspuns greșit

Vezi ce modele AI au cele mai mari șanse să întâmpine Răspuns greșit la Specific domeniului, ca să găsești mai repede punctele slabe.

Modele afișate

4

Eșecuri totale

314

Modelul cel mai afectat

Qwen3.6 Max Preview 3
Rang Model Companie Număr de Răspuns greșit Scor de categorie Teste corecte Timp de răspuns (mediu)
#122 GLM 4.7 Flash none Z.ai 1 7.7 2/3 744ms
#130 MiniMax M2.7 medium Minimax 1 3.0 0/3 19.0s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms

Top modele după Număr de Răspuns greșit

Număr de Răspuns greșit vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat