AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	Kimi K2.6 Kimi K2.6 none Lançamento: 2026-04-20	GLM 5 Turbo GLM 5 Turbo none Lançamento: 2026-03-15

Métrica	Kimi K2.6 Kimi K2.6 none Lançamento: 2026-04-20	GLM 5 Turbo GLM 5 Turbo none Lançamento: 2026-03-15
Pontuação	5.6	5.3
Posição	#110	#125
Confiabilidade	8.3	10.0
Consistência	9.2	9.3
Testes corretos
Taxa de acerto por tentativa	38.3%	33.3%
Testes instáveis	2	2
Execuções totais	60	60
Custo por resultado	1.250	0.602
Custo total	$0.088	$0.037
Preço de entrada	$0.730 / 1M	$1.200 / 1M
Preço de saída	$3.490 / 1M	$4.000 / 1M
Tokens de saída	16,563	1,809
Tokens de raciocínio	0	0
Tempo de resposta (médio)	13.86s	2.83s
Tempo de resposta (máx.)	238.89s	8.21s
Tempo de resposta (total)	277.18s	56.58s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	471	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	6.8	9.8	50.0%	0		122.77s	14,749	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	290	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	201	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	42	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	138	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	72	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	3.2	9.8	0.0%	0		1.66s	343	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	240	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	17	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Comparação rápida

Trocar par de comparação

Kimi K2.6nonevsgpt-oss-120bmediumDisponível grátis Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumDisponível grátisvsGLM 5 Turbonone CobuddymediumDisponível grátisvsKimi K2.6none MiniMax M2.5mediumDisponível grátisvsKimi K2.6none Mistral Small 4mediumvsKimi K2.6none Kimi K2.6nonevsElephant Alphamedium Kimi K2.6nonevsOwl Alphamedium MiniMax M2.7mediumvsGLM 5 Turbonone gpt-oss-120bmediumDisponível grátisvsGLM 5 Turbonone Kimi K2.6nonevsNemotron 3 SupermediumDisponível grátis