AI BENCHY
Advertise here

Eșecuri AI BENCHY

Eșecuri Eroare API

Vezi ce modele AI se lovesc cel mai des de Eroare API, ca să identifici riscurile de fiabilitate înainte să alegi. Sortează după: Teste corecte ↓.

Modele afișate

15

Eșecuri totale

144

Modelul cel mai afectat

Gemini 3.5 Flash 3
Rang Model Companie Număr de Eroare API Scor Teste corecte Timp de răspuns (mediu)
#20 Gemini 3.5 Flash none Google 3 8.1 15/21 9.93s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 1 7.9 14/21 73.8s
#26 Qwen3.6 Plus medium Qwen 1 7.9 14/21 30.7s
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#33 Hy3 preview medium Tencent 3 7.7 14/21 16.3s
#35 Gemini 3 PRO Preview medium Google 4 7.6 14/21 9.05s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 1 7.5 13/21 15.1s
#46 Qwen3.6 35B A3B medium Qwen 2 7.4 13/21 18.1s
#43 MiMo-V2.5-Pro medium Xiaomi 1 7.5 12/21 26.1s
#49 Qwen3.5-Flash medium Qwen 1 7.4 12/21 63.3s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#55 GLM 5.1 medium Z.ai 1 7.3 12/21 33.7s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#66 Qwen3.5-35B-A3B medium Qwen 1 7.1 11/21 72.6s
#72 DeepSeek V3.2 medium DeepSeek 2 7.0 11/21 68.7s

Top modele după Număr de Eroare API

Număr de Eroare API vs Scor

Top modele după Timp de răspuns (mediu)