AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas por categoria AI BENCHY

Resolução de quebra-cabeças: Tempo esgotado

Resolução de quebra-cabeças
Tempo esgotado

Veja quais modelos de IA têm mais chance de encontrar Tempo esgotado em Resolução de quebra-cabeças, para identificar pontos fracos mais rápido.

Modelos exibidos

4

Falhas totais

6

Modelo mais afetado

Qwen3.5-Flash 2
Posição Modelo Empresa Contagem de Tempo esgotado Pontuação da categoria Testes corretos Tempo de resposta (médio)
#32 Qwen3.5-Flash medium Qwen 2 6.4 1/3 56.7s
#97 Qwen3.5-9B medium Qwen 2 3.1 0/3 33.4s
#43 Qwen3.5-35B-A3B medium Qwen 1 6.4 1/3 31.6s
#71 MiniMax M2.5 medium Minimax 1 5.3 1/3 11.5s

Melhores modelos por Contagem de Tempo esgotado

Contagem de Tempo esgotado vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado