AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Eșecuri AI BENCHY

Eșecuri Eroare API

Vezi ce modele AI se lovesc cel mai des de Eroare API, ca să identifici riscurile de fiabilitate înainte să alegi. Sortează după: Număr de eșecuri ↑.

Modele afișate

9

Eșecuri totale

144

Modelul cel mai afectat

Qwen3.5 Plus 2026-02-15 1
Rang Model Companie Număr de Eroare API Scor Teste corecte Timp de răspuns (mediu)
#156 Hy3 preview none Tencent 4 4.4 4/21 12.9s
#160 LFM2-24B-A2B none Liquid 4 4.2 2/16 782ms
#96 Ring-2.6-1T none Inclusionai 5 6.2 9/21 55.1s
#103 DeepSeek V4 Pro high DeepSeek 5 6.0 8/21 65.2s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 6 4.6 4/19 17.1s
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 6 4.1 2/19 728ms
#82 Hy3 preview high Tencent 7 6.6 11/21 56.6s
#89 Hy3 preview low Tencent 7 6.4 10/21 24.6s
#93 Qwen3.6 Plus Preview medium Qwen 8 6.3 9/19 15.2s

Top modele după Număr de Eroare API

Număr de Eroare API vs Scor

Top modele după Timp de răspuns (mediu)