AI BENCHY
Advertise here

Falhas AI BENCHY

Falhas por Erro de API

Veja quais modelos de IA encontram Erro de API com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Pontuação ↓.

Modelos exibidos

15

Falhas totais

144

Modelo mais afetado

Gemini 3.5 Flash 3
Posição Modelo Empresa Contagem de Erro de API Pontuação Testes corretos Tempo de resposta (médio)
#20 Gemini 3.5 Flash none Google 3 8.1 15/21 9.93s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 1 7.9 14/21 73.8s
#26 Qwen3.6 Plus medium Qwen 1 7.9 14/21 30.7s
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#33 Hy3 preview medium Tencent 3 7.7 14/21 16.3s
#35 Gemini 3 PRO Preview medium Google 4 7.6 14/21 9.05s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 1 7.5 13/21 15.1s
#43 MiMo-V2.5-Pro medium Xiaomi 1 7.5 12/21 26.1s
#46 Qwen3.6 35B A3B medium Qwen 2 7.4 13/21 18.1s
#49 Qwen3.5-Flash medium Qwen 1 7.4 12/21 63.3s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#55 GLM 5.1 medium Z.ai 1 7.3 12/21 33.7s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#66 Qwen3.5-35B-A3B medium Qwen 1 7.1 11/21 72.6s
#72 DeepSeek V3.2 medium DeepSeek 2 7.0 11/21 68.7s

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)