Falhas por categoria AI BENCHY
Conhecimentos gerais: Erro de API
Conhecimentos gerais
Erro de API
Veja quais modelos de IA têm mais chance de encontrar Erro de API em Conhecimentos gerais, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Erro de API | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #35 | Gemini 3 PRO Preview medium | 1 | 3.0 | 0/1 | 0ms | |
| #92 | Laguna M.1 medium | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/1 | 0ms |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #136 | Elephant Alpha medium | Openrouter | 1 | 3.0 | 0/1 | 0ms |
| #137 | Elephant Alpha none | Openrouter | 1 | 3.0 | 0/1 | 0ms |
| #145 | Laguna M.1 none | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #146 | Laguna Xs.2 none | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 3.0 | 0/1 | 0ms |
| #159 | Ling-2.6-1T none | Inclusionai | 1 | 3.0 | 0/1 | 0ms |
| #162 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 1 | 3.0 | 0/1 | 0ms |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 3.0 | 0/1 | 177.0s |