Falhas por categoria AI BENCHY
Resolução de quebra-cabeças: Sem resposta
Resolução de quebra-cabeças
Sem resposta
Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Resolução de quebra-cabeças, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↓.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Sem resposta | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #56 | MiMo-V2.5 medium | Xiaomi | 1 | 8.2 | 2/3 | 20.3s |