AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas AI BENCHY

Falhas por Sem resposta

Veja quais modelos de IA encontram Sem resposta com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

15

Falhas totais

43

Modelo mais afetado

Claude Opus 4.8 1
Posição Modelo Empresa Contagem de Sem resposta Pontuação Testes corretos Tempo de resposta (médio)
#158 GLM 4.7 Flash medium Z.ai 3 4.4 4/21 35.1s
#130 MiniMax M2.7 medium Minimax 1 5.3 5/21 38.2s
#80 Mimo V2 Omni medium Xiaomi 2 6.7 10/21 41.2s
#27 Gemma 4 31B medium Google 1 7.8 14/21 56.5s
#78 Qwen3.6 27B medium Qwen 3 6.8 10/21 59.7s
#53 Gemini 3.1 Flash Lite high Google 1 7.3 10/18 62.0s
#37 Gemma 4 26B A4B medium Google 2 7.6 14/21 63.4s
#71 Step 3.7 Flash high Stepfun 4 7.0 11/21 64.5s
#129 MiniMax M2.5 medium Minimax 1 5.3 5/21 65.4s
#67 MiniMax M3 medium Minimax 1 7.1 11/21 68.2s
#60 Kimi K2.6 medium Moonshot AI 1 7.2 12/21 71.7s
#62 Step 3.5 Flash medium Stepfun 1 7.2 11/20 72.5s
#66 Qwen3.5-35B-A3B medium Qwen 2 7.1 11/21 72.6s
#161 Qwen3.5-9B medium Qwen 2 4.2 3/21 82.2s
#76 Kimi K2.5 medium Moonshot AI 2 6.8 10/21 98.4s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)