AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	Grok 4.20 Grok 4.20 none Lançamento: 2026-03-31	GLM 5 Turbo GLM 5 Turbo none Lançamento: 2026-03-15

Métrica	Grok 4.20 Grok 4.20 none Lançamento: 2026-03-31	GLM 5 Turbo GLM 5 Turbo none Lançamento: 2026-03-15
Pontuação	5.4	5.3
Posição	#120	#125
Confiabilidade	N/D	10.0
Consistência	9.5	9.3
Testes corretos
Taxa de acerto por tentativa	35.2%	33.3%
Testes instáveis	1	2
Execuções totais	54	60
Custo por resultado	1.574	0.602
Custo total	$0.095	$0.037
Preço de entrada	$1.250 / 1M	$1.200 / 1M
Preço de saída	$2.500 / 1M	$4.000 / 1M
Tokens de saída	1,967	1,809
Tokens de raciocínio	0	0
Tempo de resposta (médio)	1.11s	2.83s
Tempo de resposta (máx.)	6.04s	8.21s
Tempo de resposta (total)	20.02s	56.58s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	4.8	10.0	25.0%	0		501ms	267	0
GLM 5 Turbo	3.0	10.0	0.0%	0		2.84s	382	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	3.4	9.3	0.0%	0		1.22s	312	0
GLM 5 Turbo	4.4	6.7	16.7%	1		2.58s	523	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	3.0	10.0	0.0%	0		6.04s	282	0
GLM 5 Turbo	3.0	10.0	0.0%	0		4.89s	144	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	10.0	10.0	100.0%	0		522ms	207	0
GLM 5 Turbo	10.0	10.0	100.0%	0		2.47s	204	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	3.0	10.0	0.0%	0		687ms	325	0
GLM 5 Turbo	5.3	10.0	33.3%	0		1.97s	25	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	4.8	10.0	0.0%	0		659ms	83	0
GLM 5 Turbo	4.2	9.9	0.0%	0		2.18s	48	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	6.3	10.0	50.0%	0		455ms	60	0
GLM 5 Turbo	6.5	10.0	50.0%	0		2.13s	65	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	5.3	7.2	44.4%	1		487ms	242	0
GLM 5 Turbo	5.5	7.4	44.4%	1		2.43s	180	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	10.0	10.0	100.0%	0		4.63s	189	0
GLM 5 Turbo	10.0	10.0	100.0%	0		8.21s	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Grok 4.20	-	-	-	-	-	-	-	-
GLM 5 Turbo	3.0	10.0	0.0%	0		2.37s	16	0

Comparação rápida

Trocar par de comparação

Mistral Small 4mediumvsGrok 4.20none MiniMax M2.5mediumDisponível grátisvsGrok 4.20none Elephant AlphamediumvsGrok 4.20none Elephant AlphamediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 5 Turbonone MiniMax M2.5mediumDisponível grátisvsGLM 5 Turbonone gpt-oss-120bmediumDisponível grátisvsGrok 4.20none MiniMax M2.7mediumvsGLM 5 Turbonone gpt-oss-120bmediumDisponível grátisvsGLM 5 Turbonone CobuddymediumDisponível grátisvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none CobuddymediumDisponível grátisvsGLM 5 Turbonone