AI BENCHY
Your ad here

Eșecuri pe categorii AI BENCHY

Combinat: Răspuns greșit

Combinat
Răspuns greșit

Vezi ce modele AI au cele mai mari șanse să întâmpine Răspuns greșit la Combinat, ca să găsești mai repede punctele slabe.

Modele afișate

15

Eșecuri totale

37

Modelul cel mai afectat

Gemini 3 Flash Preview 1
Rang Model Companie Număr de Răspuns greșit Scor de categorie Teste corecte Timp de răspuns (mediu)
#5 Gemini 3 Flash Preview low Google 1 3.0 0/1 3.27s
#12 Gemini 3 PRO Preview medium Google 1 3.0 0/1 10.4s
#21 Gemini 3 Flash Preview none Google 1 4.7 0/1 3.56s
#22 Gemini 3.1 Flash Lite Preview low Google 1 3.0 0/1 11.9s
#23 MiMo-V2-Pro medium Xiaomi 1 4.7 0/1 64.7s
#29 Gemini 3.1 Flash Lite Preview none Google 1 3.0 0/1 3.20s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 1 3.0 0/1 6.65s
#53 GLM 5 none Z.ai 1 3.0 0/1 4.98s
#55 MiMo-V2-Omni none Xiaomi 1 3.0 0/1 2.47s
#58 GLM 5V Turbo none Z.ai 1 3.0 0/1 6.51s
#59 Qwen3.5-Flash none Qwen 1 3.0 0/1 6.22s
#60 Gemma 4 26B A4B none Google 1 3.0 0/1 30.5s
#61 Seed-2.0-Lite none Bytedance Seed 1 3.0 0/1 6.59s
#62 Gemini 2.5 Flash none Google 1 3.0 0/1 4.39s
#63 Qwen3.5-35B-A3B none Qwen 1 3.0 0/1 47.4s

Top modele după Număr de Răspuns greșit

Număr de Răspuns greșit vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat