AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas AI BENCHY

Falhas por Sem resposta

Veja quais modelos de IA encontram Sem resposta com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Testes corretos ↑.

Modelos exibidos

7

Falhas totais

8

Modelo mais afetado

GLM 4.7 Flash 2
Posição Modelo Empresa Contagem de Sem resposta Pontuação Testes corretos Tempo de resposta (médio)
#93 GLM 4.7 Flash medium Z.ai 2 4.6 4/18 32.3s
#46 Kimi K2.5 medium Moonshot AI 1 7.0 9/18 72.4s
#52 Grok 4.1 Fast medium X AI 1 6.7 9/18 23.9s
#43 Qwen3.5-35B-A3B medium Qwen 1 7.4 10/18 44.5s
#35 MiMo-V2-Omni medium Xiaomi 1 7.7 11/18 16.8s
#40 GPT-5.2 medium OpenAI 1 7.5 11/18 14.0s
#13 GLM 5 medium Z.ai 1 8.4 13/18 23.3s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)