Falhas por categoria AI BENCHY
Seguimento de instruções: Formatação extra
Seguimento de instruções
Formatação extra
Veja quais modelos de IA têm mais chance de encontrar Formatação extra em Seguimento de instruções, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Formatação extra | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #108 | HY3 Preview none | Tencent | 1 | 6.3 | 1/2 | 13.0s |
| #92 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | 1/2 | 17.5s |