AI BENCHY
Advertise here

Eșecuri AI BENCHY

Eșecuri Eroare API

Vezi ce modele AI se lovesc cel mai des de Eroare API, ca să identifici riscurile de fiabilitate înainte să alegi. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

9

Eșecuri totale

144

Rang Model Companie Număr de Eroare API Scor Teste corecte Timp de răspuns (mediu)
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#82 Hy3 preview high Tencent 7 6.6 11/21 56.6s
#75 Ring-2.6-1T medium Inclusionai 2 6.9 11/21 61.3s
#49 Qwen3.5-Flash medium Qwen 1 7.4 12/21 63.3s
#103 DeepSeek V4 Pro high DeepSeek 5 6.0 8/21 65.2s
#72 DeepSeek V3.2 medium DeepSeek 2 7.0 11/21 68.7s
#66 Qwen3.5-35B-A3B medium Qwen 1 7.1 11/21 72.6s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 1 7.9 14/21 73.8s
#161 Qwen3.5-9B medium Qwen 1 4.2 3/21 82.2s

Top modele după Număr de Eroare API

Număr de Eroare API vs Scor

Top modele după Timp de răspuns (mediu)