AI BENCHY
Advertise here

Falhas por categoria AI BENCHY

Seguimento de instruções: Sem resposta

Seguimento de instruções
Sem resposta

Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Seguimento de instruções, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↓.

Modelos exibidos

2

Falhas totais

2

Modelo mais afetado

Gemini 3.1 Flash Lite 1

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado