Falhas por categoria AI BENCHY
Específico do domínio: Não seguiu as instruções
Específico do domínio
Não seguiu as instruções
Veja quais modelos de IA têm mais chance de encontrar Não seguiu as instruções em Específico do domínio, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↓.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Não seguiu as instruções | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #82 | Grok Build 0.1 none | X AI | 1 | 3.6 | 0/3 | 103.7s |