Falhas por categoria AI BENCHY
Seguimento de instruções: Formatação extra
Seguimento de instruções
Formatação extra
Veja quais modelos de IA têm mais chance de encontrar Formatação extra em Seguimento de instruções, para identificar pontos fracos mais rápido.
Motivos de falha
2/2
Filtrar modelos
Nenhum modelo corresponde à pesquisa e aos filtros atuais.
| Posição | Modelo | Empresa | Contagem de Formatação extra | Pontuação da categoria | Custo total | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|
| #117 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | $0.007 | 1/2 | 17.5s |
| #158 | Hy3 preview none | Tencent | 1 | 6.3 | $0.003 | 1/2 | 13.0s |