Falhas por categoria AI BENCHY
Seguimento de instruções: Erro de API
Seguimento de instruções
Erro de API
Veja quais modelos de IA têm mais chance de encontrar Erro de API em Seguimento de instruções, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↓.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Erro de API | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |