AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite Preview

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-16

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lançamento: 2026-03-03

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lançamento: 2026-03-03
Pontuação	8.0	8.1
Posição	#27	#22
Consistência	8.2	10.0
Testes corretos
Taxa de acerto por tentativa	79.6%	72.2%
Testes instáveis	4	0
Execuções totais	54	54
Custo por resultado	0.240	0.168
Custo total	$0.029	$0.022
Preço de entrada	$0.260 / 1M	$0.250 / 1M
Preço de saída	$0.380 / 1M	$1.500 / 1M
Tokens de saída	10,620	2,247
Tokens de raciocínio	48,511	8,058
Tempo de resposta (médio)	46.41s	3.22s
Tempo de resposta (máx.)	180.92s	11.91s
Tempo de resposta (total)	835.33s	58.00s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	8.4	9.9	75.0%	0		30.72s	3,773	7,523
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	462	1,638

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.20s	630	372

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	225	762

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	291	696

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	5.3	7.2	44.4%	1		39.32s	3,081	7,856
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	18	1,212

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	5.4	2.5	66.7%	1		31.30s	68	2,366
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	69	384

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	72	753

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	8.2	7.2	88.9%	1		36.87s	390	6,281
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.76s	243	1,248

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	237	993

Comparação rápida

Trocar par de comparação

Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plusmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-122B-A10Bmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium DeepSeek V3.2mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4medium DeepSeek V3.2mediumvsGemini 3 Flash Previewnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsStep 3.5 Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium