Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5.3-Codex

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-24

Métrica DeepSeek V4 Flash DeepSeek V4 Flash high Lançamento: 2026-04-24 GPT-5.3-Codex GPT-5.3-Codex medium Lançamento: 2026-02-05
Pontuação 7.8 8.6
Posição #37 #8
Confiabilidade N/D N/D
Consistência 7.8 8.7
Testes corretos
Taxa de acerto por tentativa 79.6% 83.3%
Testes instáveis 5 3
Execuções totais 52 54
Custo por resultado 0.189 4.405
Custo total $0.021 $0.573
Preço de entrada $0.140 / 1M $1.750 / 1M
Preço de saída $0.280 / 1M $14.000 / 1M
Tokens de saída 1,757 2,279
Tokens de raciocínio 55,907 35,179
Tempo de resposta (médio) 47.47s 15.38s
Tempo de resposta (máx.) 255.28s 100.93s
Tempo de resposta (total) 854.45s 276.91s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 4.1 4.4 44.5% 2 112.69s 19 24,857
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

Comparação rápida

Trocar par de comparação