AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

Falhas AI BENCHY

Falhas por Sem resposta

Veja quais modelos de IA encontram Sem resposta com mais frequência para identificar riscos de confiabilidade antes de escolher.

Modelos exibidos

6

Falhas totais

7

Modelo mais afetado

GLM 4.7 Flash 2
Posição Modelo Empresa Contagem de Sem resposta Pontuação média Testes corretos Tempo de resposta (médio)
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs pontuação média

Melhores modelos por Tempo de resposta (médio)