AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Z.ai: GLM 5V Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-02

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	GLM 5V Turbo GLM 5V Turbo medium Lançamento: 2026-04-01

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	GLM 5V Turbo GLM 5V Turbo medium Lançamento: 2026-04-01
Pontuação	6.4	7.7
Posição	#50	#30
Consistência	8.5	7.4
Testes corretos
Taxa de acerto por tentativa	51.0%	76.5%
Testes instáveis	3	6
Execuções totais	51	51
Custo por resultado	0.220	2.697
Custo total	$0.016	$0.270
Preço de entrada	$0.260 / 1M	$1.200 / 1M
Preço de saída	$0.380 / 1M	$4.000 / 1M
Tokens de saída	7,831	1,947
Tokens de raciocínio	0	54,313
Tempo de resposta (médio)	12.35s	15.03s
Tempo de resposta (máx.)	115.89s	67.08s
Tempo de resposta (total)	209.94s	255.55s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
GLM 5V Turbo	7.2	6.1	75.0%	2		10.76s	587	7,872

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
GLM 5V Turbo	6.9	3.8	66.7%	1		15.06s	403	2,523

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
GLM 5V Turbo	10.0	10.0	100.0%	0		9.60s	236	4,333

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
GLM 5V Turbo	5.3	7.2	44.4%	1		38.15s	32	29,035

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
GLM 5V Turbo	10.0	10.0	100.0%	0		11.09s	131	2,183

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
GLM 5V Turbo	9.9	10.0	100.0%	0		3.74s	72	1,813

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
GLM 5V Turbo	7.7	7.3	77.8%	1		10.91s	193	5,789

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
GLM 5V Turbo	7.0	3.7	66.7%	1		12.53s	293	765

Comparação rápida

Trocar par de comparação

DeepSeek V3.2nonevsMercury 2medium GPT-5.2 ChatnonevsGLM 5V Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5V Turbomedium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGrok 4.20 Multi Agent Betamedium GPT-5.3 ChatnonevsGLM 5V Turbomedium Gemini 3 Flash PreviewnonevsGLM 5V Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5V Turbomedium DeepSeek V3.2nonevsgpt-oss-120bmediumDisponível grátis Claude Sonnet 4.6nonevsGLM 5V Turbomedium DeepSeek V3.2nonevsMiniMax M2.5mediumDisponível grátis DeepSeek V3.2nonevsGPT-5 Minimedium