Falhas AI BENCHY
Falhas por Erro de API
Veja quais modelos de IA encontram Erro de API com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Testes corretos ↑.
| Posição | Modelo | Empresa | Contagem de Erro de API | Pontuação | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #14 | Gemma 4 31B medium | 2 | 8.3 | 13/18 | 24.9s | |
| #20 | Qwen3.6 Plus medium | Qwen | 1 | 8.1 | 13/18 | 15.3s |
| #12 | Gemini 3 PRO Preview medium | 1 | 8.4 | 14/18 | 9.06s |