Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5.3 Chat

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-02

Métrica DeepSeek V3.2 DeepSeek V3.2 medium Lançamento: 2025-12-01 GPT-5.3 Chat GPT-5.3 Chat none Lançamento: 2026-03-03
Pontuação 6.9 7.4
Posição #81 #57
Confiabilidade 10.0 10.0
Consistência 7.9 8.4
Testes corretos
Taxa de acerto por tentativa 63.3% 68.3%
Testes instáveis 6 4
Execuções totais 60 60
Custo por resultado 0.335 3.350
Custo total $0.037 $0.402
Preço de entrada $0.252 / 1M $1.750 / 1M
Preço de saída $0.378 / 1M $14.000 / 1M
Total de tokens de entrada 35,744 31,590
Tokens de saída 7,177 24,757
Tokens de raciocínio 68,297 0
Tempo de resposta (médio) 53.34s 6.13s
Tempo de resposta (máx.) 189.03s 18.33s
Tempo de resposta (total) 1066.71s 122.61s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 8.7 10.0 83.3% 1 24.23s 448 3,247 6,953
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 3,128 640 21,230
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,683 4,772 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 14,283 571 6,296
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 7,388 207 7,693
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 472 21 6,838
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 3.4 2.5 33.3% 1 58.29s 314 49 2,189
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 627 1,397 2,845
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 594 518 6,375
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 8,307 507 859
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 183 20 7,019
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

Comparação rápida

Trocar par de comparação