MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.7 Max

Qwen3.7 Max lidera na pontuação média com 7.4 vs 7.2. Qwen3.7 Max tem menor custo de benchmark com $0.197 vs $1.036. Qwen3.7 Max é mais rápido com 4.52s vs 109.98s, com taxas de acerto de 63.6% vs 68.2%.

Modelo recomendadoQwen3.7 MaxTem a melhor pontuação aqui (7.4) e custa cerca de 5.3x menos que Kimi K2.6 (medium).

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-20

Métrica	Kimi K2.6 Kimi K2.6 medium Lançamento: 2026-04-20	Qwen3.7 Max Qwen3.7 Max none Lançamento: 2026-05-22

Métrica	Kimi K2.6 Kimi K2.6 medium Lançamento: 2026-04-20	Qwen3.7 Max Qwen3.7 Max none Lançamento: 2026-05-22
Pontuação	7.2	7.4
Posição	#68	#59
Confiabilidade	9.4	9.9
Consistência	8.3	10.0
Testes corretos
Taxa de acerto por tentativa	63.6%	68.2%
Testes instáveis	4	0
Execuções totais	66	66
Custo por resultado	9.821	1.582
Custo total	$1.036	$0.197
Preço de entrada	$0.684 / 1M	$1.475 / 1M
Preço de saída	$3.420 / 1M	$4.425 / 1M
Total de tokens de entrada	68,902	95,983
Tokens de saída	111,680	12,446
Tokens de raciocínio	279,860	0
Tempo de resposta (médio)	109.98s	4.52s
Tempo de resposta (máx.)	876.20s	72.30s
Tempo de resposta (total)	2309.56s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 MoonshotAI: Kimi K2.6

medium

Custo: $0.013
Tempo: 103.4s
Tokens: 3,620 tok

#59 Qwen3.7 Max

none

Custo: $0.046
Tempo: 195.0s
Tokens: 12,171 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Comparação rápida

Trocar par de comparação

KAT-Coder-Pro V2.5highvsKimi K2.6medium Kimi K2.6mediumvsStep 3.7 Flashlow LongCat 2.0mediumvsQwen3.7 Maxnone Claude Opus 4.8nonevsKimi K2.6medium GPT-5.4 MinimediumvsQwen3.7 Maxnone GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone Kimi K2.6mediumvsQwen3.7 Plusnone GPT-5.4 NanomediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumDisponível grátisvsQwen3.7 Maxnone