Falhas por categoria AI BENCHY
Seguimento de instruções: Sem resposta
Seguimento de instruções
Sem resposta
Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Seguimento de instruções, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Sem resposta | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #161 | Qwen3.5-9B medium | Qwen | 1 | 6.5 | 1/2 | 5.75s |
| #53 | Gemini 3.1 Flash Lite high | 1 | 7.3 | 1/2 | 23.3s |