Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs DeepSeek: DeepSeek V4 Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24 DeepSeek V4 Pro DeepSeek V4 Pro none Lançamento: 2026-04-24
Pontuação 6.6 6.0
Posição #80 #95
Confiabilidade 9.0 8.1
Consistência 8.3 8.9
Testes corretos
Taxa de acerto por tentativa 66.7% 48.3%
Testes instáveis 4 3
Execuções totais 60 60
Custo por resultado 1.927 0.564
Custo total $0.212 $0.046
Preço de entrada $0.435 / 1M $0.435 / 1M
Preço de saída $0.870 / 1M $0.870 / 1M
Tokens de saída 12,211 5,347
Tokens de raciocínio 53,774 0
Tempo de resposta (médio) 58.93s 13.48s
Tempo de resposta (máx.) 358.35s 58.65s
Tempo de resposta (total) 1119.75s 269.56s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 7.4 10.0 75.0% 0 16.53s 71 3,617
DeepSeek V4 Pro 3.5 8.0 16.7% 1 14.02s 704 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 2.8 5.0 25.0% 1 51.77s 105 2,641
DeepSeek V4 Pro 5.4 6.8 33.3% 1 8.27s 527 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 465 5,914
DeepSeek V4 Pro 9.5 10.0 100.0% 0 25.49s 1,911 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 8.8 10.0 100.0% 0 23.62s 229 1,710
DeepSeek V4 Pro 8.8 10.0 100.0% 0 30.54s 170 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 6.9 16.7% 1 205.66s 10,529 28,089
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.17s 18 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
DeepSeek V4 Pro 4.3 9.9 0.0% 0 3.75s 132 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
DeepSeek V4 Pro 6.3 10.0 50.0% 0 8.23s 64 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 7.4 7.2 88.9% 1 34.92s 106 3,835
DeepSeek V4 Pro 7.6 7.2 77.8% 1 19.72s 175 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593
DeepSeek V4 Pro 10.0 10.0 100.0% 0 5.92s 219 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 53 3,807
DeepSeek V4 Pro 3.0 10.0 0.0% 0 15.59s 1,427 0

Comparação rápida

Trocar par de comparação