AI BENCHY
Advertise here

Eșecuri pe categorii AI BENCHY

Specific domeniului: Timp expirat

Specific domeniului
Timp expirat

Vezi ce modele AI au cele mai mari șanse să întâmpine Timp expirat la Specific domeniului, ca să găsești mai repede punctele slabe.

Modele afișate

11

Eșecuri totale

34

Modelul cel mai afectat

Seed-2.0-Mini 3
Rang Model Companie Număr de Timp expirat Scor de categorie Teste corecte Timp de răspuns (mediu)
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#54 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#55 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#72 DeepSeek V3.2 medium DeepSeek 1 2.9 0/3 24.3s
#76 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#86 Grok 4.1 Fast medium X AI 1 5.8 1/3 121.8s
#94 GPT-5 Nano medium OpenAI 1 5.2 1/3 204.0s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#105 Nemotron 3 Super medium NVIDIA 1 2.9 0/3 16.2s
#129 MiniMax M2.5 medium Minimax 1 2.9 0/3 237.3s

Top modele după Număr de Timp expirat

Număr de Timp expirat vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat