AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 26B A4B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-04

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	Gemma 4 26B A4B Gemma 4 26B A4B none Lançamento: 2026-04-03

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01	Gemma 4 26B A4B Gemma 4 26B A4B none Lançamento: 2026-04-03
Pontuação	6.4	6.3
Posição	#51	#53
Consistência	8.5	9.1
Testes corretos
Taxa de acerto por tentativa	51.0%	47.1%
Testes instáveis	3	2
Execuções totais	51	51
Custo por resultado	0.220	0.068
Custo total	$0.016	$0.005
Preço de entrada	$0.260 / 1M	$0.130 / 1M
Preço de saída	$0.380 / 1M	$0.400 / 1M
Tokens de saída	7,831	1,335
Tokens de raciocínio	0	0
Tempo de resposta (médio)	12.35s	6.56s
Tempo de resposta (máx.)	115.89s	57.10s
Tempo de resposta (total)	209.94s	111.54s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Gemma 4 26B A4B	8.3	10.0	75.0%	0		1.28s	230	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemma 4 26B A4B	3.0	10.0	0.0%	0		30.53s	309	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		1.70s	285	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
Gemma 4 26B A4B	3.6	7.2	22.2%	1		2.49s	27	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Gemma 4 26B A4B	4.0	10.0	0.0%	0		3.54s	85	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemma 4 26B A4B	4.4	6.9	16.7%	1		1.08s	75	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Gemma 4 26B A4B	5.7	10.0	33.3%	0		739ms	114	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		57.10s	210	0

Comparação rápida

Trocar par de comparação

Gemma 4 26B A4BnonevsGPT-5 Nanomedium Gemma 4 26B A4BnonevsGrok 4.20 Multi Agent Betamedium Gemma 4 26B A4BnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGrok 4.20 Multi Agent Betamedium Gemma 4 26B A4Bnonevsgpt-oss-120bmediumDisponível grátis DeepSeek V3.2nonevsgpt-oss-120bmediumDisponível grátis Gemma 4 26B A4BnonevsMiniMax M2.5mediumDisponível grátis DeepSeek V3.2nonevsMiniMax M2.5mediumDisponível grátis DeepSeek V3.2nonevsGPT-5 Minimedium DeepSeek V3.2nonevsNemotron 3 SupermediumDisponível grátis