AI BENCHY
Advertise here

Categoria AI BENCHY

Ranking de Programação

Veja quais modelos de IA vão melhor em Programação, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

15

Média de Pontuação de Programação

6.1

Posição Modelo Empresa Pontuação de Programação Pontuação Testes corretos Tempo de resposta (médio)
#114 GPT-5.4 none OpenAI 6.8 5.6 1/2 1.99s
#133 Qwen3 Coder Next none Qwen 5.4 5.1 0/2 2.01s
#144 MiMo-V2-Flash none Xiaomi 4.9 4.7 0/2 2.04s
#139 GPT-4o-mini none OpenAI 3.2 4.9 0/2 2.05s
#103 Qwen3.5 Plus 2026-04-20 none Qwen 4.4 5.8 0/2 2.08s
#125 Qwen3.5-122B-A10B none Qwen 4.0 5.4 0/2 2.14s
#41 Gemini 3 Flash Preview none Google 6.8 7.7 1/2 2.19s
#87 Mercury 2 medium Inception 7.2 6.5 1/2 2.29s
#117 Qwen3.6 Flash none Qwen 6.6 5.5 1/2 2.34s
#89 Qwen3.5 Plus 2026-02-15 none Qwen 4.9 6.4 0/2 2.54s
#127 GLM 5 Turbo none Z.ai 4.4 5.3 0/2 2.58s
#110 MiMo-V2-Pro none Xiaomi 6.8 5.7 1/2 2.65s
#93 MiMo-V2-Omni none Xiaomi 5.1 6.2 0/2 2.75s
#10 Claude Opus 4.7 none Anthropic 10.0 8.9 1/1 2.84s
#124 Laguna M.1 none Poolside 7.5 5.4 0/1 2.93s

Melhores modelos por Pontuação de Programação

Pontuação de Programação vs custo total

Melhores modelos por Tempo de resposta (médio)