Categoria AI BENCHY
Ranking de Combinado
Veja quais modelos de IA vão melhor em Combinado, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↓.
| Posição | Modelo | Empresa | Pontuação de Combinado | Pontuação | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #57 | Step 3.7 Flash low | Stepfun | 10.0 | 7.3 | 1/1 | 7.98s |
| #147 | GPT-4o-mini none | OpenAI | 3.0 | 4.8 | 0/1 | 7.58s |
| #95 | Qwen3.5 Plus 2026-02-15 none | Qwen | 3.0 | 6.3 | 0/1 | 6.65s |
| #110 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 5.8 | 0/1 | 6.59s |
| #120 | Mimo V2 PRO none | Xiaomi | 3.0 | 5.6 | 0/1 | 6.58s |
| #109 | GLM 5V Turbo none | Z.ai | 3.0 | 5.8 | 0/1 | 6.51s |
| #106 | Grok 4.20 Beta none | X AI | 3.0 | 5.8 | 0/1 | 6.48s |
| #3 | Gemini 3.5 Flash low | 10.0 | 9.4 | 1/1 | 6.44s | |
| #108 | Qwen3.5-Flash none | Qwen | 3.0 | 5.8 | 0/1 | 6.22s |
| #127 | Grok 4.20 none | X AI | 3.0 | 5.4 | 0/1 | 6.04s |
| #101 | Mimo V2 Omni none | Xiaomi | 3.0 | 6.0 | 0/1 | 5.96s |
| #154 | Qwen3.5-9B none | Qwen | 3.0 | 4.6 | 0/1 | 5.91s |
| #91 | GPT-5.5 none | OpenAI | 3.0 | 6.4 | 0/1 | 5.56s |
| #98 | GLM 5 none | Z.ai | 3.0 | 6.1 | 0/1 | 4.98s |
| #134 | GLM 5 Turbo none | Z.ai | 3.0 | 5.2 | 0/1 | 4.89s |