AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

Falhas AI BENCHY

Falhas por Sem resposta

Veja quais modelos de IA encontram Sem resposta com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Tempo de resposta (médio) ↓.

Modelos exibidos

6

Falhas totais

7

Modelo mais afetado

Kimi K2.5 1
Posição Modelo Empresa Contagem de Sem resposta Pontuação média Testes corretos Tempo de resposta (médio)
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs pontuação média

Melhores modelos por Tempo de resposta (médio)