AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Qwen3.6 Plus Preview

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-24

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lançamento: 2026-03-30 Disponível grátis

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lançamento: 2026-03-30 Disponível grátis
Pontuação	8.2	8.5
Posição	#20	#11
Confiabilidade	N/D	N/D
Consistência	9.6	10.0
Testes corretos
Taxa de acerto por tentativa	74.1%	76.5%
Testes instáveis	1	0
Execuções totais	24	49
Custo por resultado	1.224	0.000
Custo total	$0.160	$0.000
Preço de entrada	$1.740 / 1M	$0.000 / 1M
Preço de saída	$3.480 / 1M	$0.000 / 1M
Tokens de saída	671	1,756
Tokens de raciocínio	39,383	77,213
Tempo de resposta (médio)	71.21s	13.94s
Tempo de resposta (máx.)	351.99s	43.55s
Tempo de resposta (total)	1281.73s	237.01s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	8.3	10.0	75.0%	0		26.93s	70	2,008
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		93.00s	82	2,808
Qwen3.6 Plus Preview	-	-	-	-	-	-	-	-

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		71.08s	134	2,163
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		63.00s	67	1,071
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	5.3	10.0	33.3%	0		202.56s	11	25,343
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	5.0	10.0	0.0%	0		26.96s	51	734
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		14.60s	21	1,236
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	7.6	7.4	77.8%	1		69.69s	151	3,847
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		11.05s	84	173
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330

Comparação rápida

Trocar par de comparação

DeepSeek V4 ProhighvsGLM 5 Turbomedium DeepSeek V4 ProhighvsQwen3.5-122B-A10Bmedium Qwen3.6 Plus PreviewmediumDisponível grátisvsHY3 PreviewhighDisponível grátis DeepSeek V4 ProhighvsQwen3.6 Plusmedium DeepSeek V4 ProhighvsHY3 PreviewlowDisponível grátis DeepSeek V4 ProhighvsGemini 3 Flash Previewnone DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewlow DeepSeek V4 ProhighvsMiMo-V2.5-Promedium DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewmedium DeepSeek V4 ProhighvsMiMo-V2-Promedium DeepSeek V4 ProhighvsGPT-5.4medium DeepSeek V4 ProhighvsGemini 2.5 Flashmedium