AI BENCHY
Advertise here

Falhas AI BENCHY

Falhas por Erro de API

Veja quais modelos de IA encontram Erro de API com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Tempo de resposta (médio) ↓.

Modelos exibidos

15

Falhas totais

144

Modelo mais afetado

Qwen3.5-9B 1
Posição Modelo Empresa Contagem de Erro de API Pontuação Testes corretos Tempo de resposta (médio)
#105 Nemotron 3 Super medium NVIDIA 3 5.8 8/21 32.0s
#26 Qwen3.6 Plus medium Qwen 1 7.9 14/21 30.7s
#100 Grok Build 0.1 none X AI 3 6.0 7/19 28.7s
#43 MiMo-V2.5-Pro medium Xiaomi 1 7.5 12/21 26.1s
#89 Hy3 preview low Tencent 7 6.4 10/21 24.6s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#126 gpt-oss-120b none OpenAI 3 5.4 6/19 21.6s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#46 Qwen3.6 35B A3B medium Qwen 2 7.4 13/21 18.1s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 6 4.6 4/19 17.1s
#33 Hy3 preview medium Tencent 3 7.7 14/21 16.3s
#93 Qwen3.6 Plus Preview medium Qwen 8 6.3 9/19 15.2s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 1 7.5 13/21 15.1s
#92 Laguna M.1 medium Poolside 4 6.4 9/19 14.7s
#133 DeepSeek V3.2 none DeepSeek 4 5.2 6/21 13.8s

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)