Falhas por categoria AI BENCHY
Programação: Erro de API
Programação
Erro de API
Veja quais modelos de IA têm mais chance de encontrar Erro de API em Programação, para identificar pontos fracos mais rápido.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Erro de API | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #10 | Gemini 3 PRO Preview medium | 1 | 3.0 | 0/1 | 0ms | |
| #18 | Qwen3.6 Plus medium | Qwen | 1 | 3.0 | 0/1 | 0ms |
| #47 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/1 | 0ms |
| #48 | Nemotron 3 Super medium | NVIDIA | 1 | 3.0 | 0/1 | 0ms |
| #68 | Hunter Alpha none | OpenRouter | 1 | 3.0 | 0/1 | 0ms |
| #93 | Step 3.5 Flash none | Stepfun | 1 | 3.0 | 0/1 | 0ms |