Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs xAI: Grok 4.20

Resumo

Comparação benchmark Kimi K2.6 vs Grok 4.20: Kimi K2.6 lidera na pontuação média com 7.8 vs 7.3. Grok 4.20 tem menor custo de benchmark com $0.609 vs $0.889. Grok 4.20 é mais rápido com 27.68s vs 71.67s, com taxas de acerto de 65.1% vs 63.5%.

Modelo recomendado: Grok 4.20 - A pontuação fica perto da melhor aqui (7.3 vs 7.8) e responde cerca de 2.6x mais rápido que Kimi K2.6.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18

Métrica Kimi K2.6 Kimi K2.6 medium Lançamento: 2026-04-20 Disponível grátis Grok 4.20 Grok 4.20 medium Lançamento: 2026-03-31
Pontuação 7.8 7.3
Posição #35 #53
Confiabilidade 10.0 10.0
Consistência 8.6 8.8
Testes corretos
Taxa de acerto por tentativa 65.1% 63.5%
Testes instáveis 3 3
Execuções totais 63 63
Custo por resultado 8.358 8.309
Custo total $0.889 $0.609
Preço de entrada $0.680 / 1M $1.250 / 1M
Preço de saída $3.410 / 1M $2.500 / 1M
Total de tokens de entrada 29,450 44,433
Tokens de saída 102,923 1,819
Tokens de raciocínio 254,094 219,524
Tempo de resposta (médio) 71.67s 27.68s
Tempo de resposta (máx.) 406.78s 199.66s
Tempo de resposta (total) 1433.36s 581.26s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 MoonshotAI: Kimi K2.6

medium
Custo
$0.013
Tempo
103.4s
Tokens
3,620 tok

#53 xAI: Grok 4.20

medium
Custo
$0.041
Tempo
110.3s
Tokens
16,336 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

Comparação rápida

Trocar par de comparação