AI BENCHY
Advertise here

Eșecuri pe categorii AI BENCHY

Programare: Răspuns greșit

Programare
Răspuns greșit

Vezi ce modele AI au cele mai mari șanse să întâmpine Răspuns greșit la Programare, ca să găsești mai repede punctele slabe.

Modele afișate

15

Eșecuri totale

120

Modelul cel mai afectat

Qwen3.6 Flash 2
Rang Model Companie Număr de Răspuns greșit Scor de categorie Teste corecte Timp de răspuns (mediu)
#59 Qwen3.6 Flash medium Qwen 2 5.1 0/2 51.9s
#66 Qwen3.6 Max Preview none Qwen 2 4.2 0/2 3.06s
#77 Grok 4.20 medium X AI 2 4.1 0/2 65.1s
#88 Qwen3.5 Plus 2026-02-15 none Qwen 2 4.9 0/2 2.54s
#89 GLM 5 none Z.ai 2 4.6 0/2 5.18s
#94 GPT-5 Nano medium OpenAI 2 5.4 0/2 47.8s
#95 DeepSeek V4 Pro none DeepSeek 2 5.4 0/2 8.27s
#109 GLM 4.7 Flash none Z.ai 2 5.0 0/2 3.35s
#111 gpt-oss-120b medium OpenAI 2 3.9 0/2 47.2s
#113 GLM 5.1 none Z.ai 2 4.3 0/2 6.33s
#121 Mistral Small 4 medium Mistral 2 5.1 0/2 44.8s
#124 Qwen3.5-122B-A10B none Qwen 2 4.0 0/2 2.14s
#125 GLM 5 Turbo none Z.ai 2 4.4 0/2 2.58s
#131 DeepSeek V4 Flash none DeepSeek 2 4.8 0/2 24.5s
#132 Qwen3 Coder Next none Qwen 2 5.4 0/2 2.01s

Top modele după Număr de Răspuns greșit

Număr de Răspuns greșit vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat