AI BENCHY
Advertise here

Falhas por categoria AI BENCHY

Resolução de quebra-cabeças: Tempo esgotado

Resolução de quebra-cabeças
Tempo esgotado

Veja quais modelos de IA têm mais chance de encontrar Tempo esgotado em Resolução de quebra-cabeças, para identificar pontos fracos mais rápido. Ordenar por: Contagem de falhas ↑.

Modelos exibidos

4

Falhas totais

5

Modelo mais afetado

Qwen3.5-Flash 1
Posição Modelo Empresa Contagem de Tempo esgotado Pontuação da categoria Testes corretos Tempo de resposta (médio)
#49 Qwen3.5-Flash medium Qwen 1 8.2 2/3 27.6s
#66 Qwen3.5-35B-A3B medium Qwen 1 8.2 2/3 33.1s
#129 MiniMax M2.5 medium Minimax 1 5.3 1/3 11.2s
#161 Qwen3.5-9B medium Qwen 2 3.0 0/3 32.3s

Melhores modelos por Contagem de Tempo esgotado

Contagem de Tempo esgotado vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado