AI BENCHY
Your ad here

Eșecuri pe categorii AI BENCHY

Specific domeniului: Timp expirat

Specific domeniului
Timp expirat

Vezi ce modele AI au cele mai mari șanse să întâmpine Timp expirat la Specific domeniului, ca să găsești mai repede punctele slabe.

Modele afișate

15

Eșecuri totale

31

Modelul cel mai afectat

Seed-2.0-Mini 3
Rang Model Companie Număr de Timp expirat Scor de categorie Teste corecte Timp de răspuns (mediu)
#39 Seed-2.0-Mini medium Bytedance Seed 3 3.0 0/3 0ms
#97 Qwen3.5-9B medium Qwen 3 3.6 0/3 137.7s
#34 Kimi K2.6 medium Moonshot AI 2 5.3 1/3 202.4s
#43 Qwen3.5-35B-A3B medium Qwen 2 4.1 0/3 88.3s
#80 MiniMax M2.7 medium Minimax 2 3.0 0/3 19.0s
#3 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#10 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#13 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#23 MiMo-V2-Pro medium Xiaomi 1 5.3 1/3 6.00s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#27 DeepSeek V3.2 medium DeepSeek 1 5.3 1/3 39.3s
#32 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s

Top modele după Număr de Timp expirat

Număr de Timp expirat vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat