AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

Falhas por categoria AI BENCHY

Resolução de quebra-cabeças
Erro de API

Veja quais modelos de IA têm mais chance de encontrar Erro de API em Resolução de quebra-cabeças, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↑.

Modelos exibidos

1

Falhas totais

1

Modelo mais afetado

LFM2-24B-A2B 1

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs pontuação média

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado