Falhas por categoria AI BENCHY
Chamada de ferramentas
Sem resposta
Chamada de ferramentas
Sem resposta
Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Chamada de ferramentas, para identificar pontos fracos mais rápido. Ordenar por: Contagem de falhas ↑.
Motivos de falha relacionados
Categorias relacionadas
| Posição | Modelo | Empresa | Contagem de Sem resposta | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #27 | GPT-5.2 medium | OpenAI | 1 | 10.0 | 0/1 | 10.3s |
| #30 | Grok 4.1 Fast medium | X AI | 1 | 10.0 | 0/1 | 27.7s |