AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 31B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	Gemma 4 31B Gemma 4 31B none Lançamento: 2026-04-02 Disponível grátis

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	Gemma 4 31B Gemma 4 31B none Lançamento: 2026-04-02 Disponível grátis
Pontuação	6.2	6.7
Posição	#97	#83
Confiabilidade	10.0	10.0
Consistência	8.3	10.0
Testes corretos
Taxa de acerto por tentativa	48.3%	50.0%
Testes instáveis	4	0
Execuções totais	60	60
Custo por resultado	0.222	0.030
Custo total	$0.018	$0.003
Preço de entrada	$0.252 / 1M	$0.120 / 1M
Preço de saída	$0.378 / 1M	$0.370 / 1M
Tokens de saída	11,159	1,398
Tokens de raciocínio	0	0
Tempo de resposta (médio)	14.43s	4.05s
Tempo de resposta (máx.)	115.89s	26.13s
Tempo de resposta (total)	288.55s	72.97s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.8	8.2	12.5%	1		9.35s	1,073	0
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	45	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
Gemma 4 31B	6.8	10.0	50.0%	0		14.84s	726	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	285	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.2	6.9	16.7%	1		4.17s	21	0
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	27	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		9.32s	43	0
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	117	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	78	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		6.91s	298	0
Gemma 4 31B	6.5	10.0	33.3%	0		4.23s	108	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	12	0

Comparação rápida

Trocar par de comparação

Gemma 4 31BnoneDisponível grátisvsKimi K2.5medium DeepSeek V3.2nonevsGPT-5 Nanomedium Gemma 4 31BnoneDisponível grátisvsQwen3.6 27Bmedium Gemma 4 31BnoneDisponível grátisvsMercury 2medium Gemma 4 31BnoneDisponível grátisvsMiMo-V2-Omnimedium DeepSeek V3.2nonevsNemotron 3 SupermediumDisponível grátis DeepSeek V3.2nonevsgpt-oss-120bmediumDisponível grátis Gemma 4 31BnoneDisponível grátisvsGrok 4.20medium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V4 ProhighvsGemma 4 31BnoneDisponível grátis DeepSeek V3.2nonevsMercury 2medium Gemma 4 31BnoneDisponível grátisvsMiMo-V2-Flashmedium