Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs MoonshotAI: Kimi K2.7 Code

Resumo

Comparação benchmark Kimi K2.6 vs Kimi K2.7 Code: Kimi K2.6 lidera na pontuação média com 7.8 vs 7.0. Kimi K2.7 Code tem menor custo de benchmark com $0.669 vs $0.889. Kimi K2.6 é mais rápido com 71.67s vs 83.60s, com taxas de acerto de 65.1% vs 66.7%.

Modelo recomendado: Kimi K2.6 - Tem a pontuação mais forte nesta comparação (7.8) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 2 modelos.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica Kimi K2.6 Kimi K2.6 medium Lançamento: 2026-04-20 Disponível grátis Kimi K2.7 Code Kimi K2.7 Code medium Lançamento: 2026-06-12
Pontuação 7.8 7.0
Posição #38 #65
Confiabilidade 10.0 9.2
Consistência 8.6 7.7
Testes corretos
Taxa de acerto por tentativa 65.1% 66.7%
Testes instáveis 3 6
Execuções totais 63 63
Custo por resultado 8.358 6.074
Custo total $0.889 $0.669
Preço de entrada $0.680 / 1M $0.950 / 1M
Preço de saída $3.410 / 1M $4.000 / 1M
Total de tokens de entrada 29,450 25,991
Tokens de saída 102,923 80,516
Tokens de raciocínio 254,094 161,391
Tempo de resposta (médio) 71.67s 83.60s
Tempo de resposta (máx.) 406.78s 365.80s
Tempo de resposta (total) 1433.36s 1671.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 MoonshotAI: Kimi K2.6

medium
Cost
$0.013
Time
103.4s
Tokens
3,620 tok

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930

Comparação rápida

Trocar par de comparação