AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs DeepSeek: DeepSeek V4 Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01	DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01	DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24
Pontuação	7.0	6.6
Posição	#71	#80
Confiabilidade	9.1	9.0
Consistência	7.6	8.3
Testes corretos
Taxa de acerto por tentativa	69.2%	66.7%
Testes instáveis	6	4
Execuções totais	60	60
Custo por resultado	0.334	1.927
Custo total	$0.037	$0.212
Preço de entrada	$0.252 / 1M	$0.435 / 1M
Preço de saída	$0.378 / 1M	$0.870 / 1M
Tokens de saída	7,049	12,211
Tokens de raciocínio	68,203	53,774
Tempo de resposta (médio)	53.21s	58.93s
Tempo de resposta (máx.)	189.03s	358.35s
Tempo de resposta (total)	1064.26s	1119.75s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	9.2	10.0	100.0%	0		24.23s	3,247	6,953
DeepSeek V4 Pro	7.4	10.0	75.0%	0		16.53s	71	3,617

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.9	5.8	33.3%	1		184.97s	640	21,230
DeepSeek V4 Pro	2.8	5.0	25.0%	1		51.77s	105	2,641

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
DeepSeek V4 Pro	10.0	10.0	100.0%	0		65.02s	465	5,914

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
DeepSeek V4 Pro	8.8	10.0	100.0%	0		23.62s	229	1,710

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	21	6,838
DeepSeek V4 Pro	3.0	6.9	16.7%	1		205.66s	10,529	28,089

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.8	2.5	50.0%	1		58.29s	49	2,189
DeepSeek V4 Pro	6.1	3.1	66.7%	1		25.09s	76	1,152

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
DeepSeek V4 Pro	10.0	10.0	100.0%	0		41.16s	205	2,416

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.7	5.0	66.7%	2		36.87s	390	6,281
DeepSeek V4 Pro	7.4	7.2	88.9%	1		34.92s	106	3,835

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
DeepSeek V4 Pro	10.0	10.0	100.0%	0		21.33s	372	593

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	20	7,019
DeepSeek V4 Pro	3.0	10.0	0.0%	0		39.14s	53	3,807

Comparação rápida

Trocar par de comparação

DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsGemini 3.1 Flash Liteminimal DeepSeek V4 ProhighvsGrok Build 0.1none DeepSeek V4 ProhighvsGrok 4.20medium Claude Sonnet 4.6nonevsDeepSeek V3.2medium DeepSeek V4 ProhighvsGemma 4 31BnoneDisponível grátis DeepSeek V4 ProhighvsQwen3.6 27Bmedium DeepSeek V4 ProhighvsGemini 3.1 Flash Litenone DeepSeek V4 ProhighvsGPT-5.5none DeepSeek V3.2mediumvsQwen3.6 Max Previewnone DeepSeek V3.2mediumvsRing-2.6-1Tnone DeepSeek V4 ProhighvsQwen3.5 Plus 2026-02-15none