Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemma 4 31B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-10

Métrica DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01 Gemma 4 31B Gemma 4 31B none Lançamento: 2026-04-02 Disponível grátis
Pontuação 7.2 6.9
Posição #61 #66
Confiabilidade 10.0 10.0
Consistência 7.5 10.0
Testes corretos
Taxa de acerto por tentativa 72.8% 52.6%
Testes instáveis 6 0
Execuções totais 57 57
Custo por resultado 0.278 0.025
Custo total $0.031 $0.003
Preço de entrada $0.252 / 1M $0.130 / 1M
Preço de saída $0.378 / 1M $0.380 / 1M
Tokens de saída 7,035 1,371
Tokens de raciocínio 53,765 0
Tempo de resposta (médio) 46.06s 3.86s
Tempo de resposta (máx.) 180.92s 26.13s
Tempo de resposta (total) 875.23s 65.57s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
Gemma 4 31B 10.0 10.0 100.0% 0 26.13s 699 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
Gemma 4 31B 6.5 10.0 33.3% 0 2.95s 108 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 12 0

Comparação rápida

Trocar par de comparação