Categoria AI BENCHY
Ranking de Combinado
Veja quais modelos de IA vão melhor em Combinado, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.
| Posição | Modelo | Empresa | Pontuação de Combinado | Pontuação | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #45 | GPT-5 Mini medium | OpenAI | 10.0 | 7.0 | 1/1 | 88.2s |
| #46 | Kimi K2.5 medium | Moonshot AI | 10.0 | 7.0 | 1/1 | 71.4s |
| #47 | Grok 4.20 medium | X AI | 10.0 | 7.0 | 1/1 | 17.4s |
| #51 | Nemotron 3 Super medium | NVIDIA | 10.0 | 6.7 | 1/1 | 87.8s |
| #52 | Grok 4.1 Fast medium | X AI | 10.0 | 6.7 | 1/1 | 37.6s |
| #54 | Mercury 2 medium | Inception | 10.0 | 6.5 | 1/1 | 3.28s |
| #57 | GPT-5 Nano medium | OpenAI | 10.0 | 6.3 | 1/1 | 66.0s |
| #68 | gpt-oss-120b medium | OpenAI | 10.0 | 5.8 | 1/1 | 31.2s |