AI BENCHY
Comparar
❤️ Made by XCS
Your ad here

Nome do modelo

OpenAI: GPT-5.3-Codex

Raciocínio (medium)

Benchmarks gerados a partir das suítes de teste do AI BENCHY em : 24 de fev. de 2026

Métrica OpenAI: GPT-5.3-Codex
Posição#6
EmpresaOpenAI
Score 7.77
Consistência 8.75
Custo por resultado 4.9342
Custo total $0.44408
Testes corretos
Taxa de acerto por tentativa 76.9%
Testes instáveis 2
Tokens de saída 947
Tokens de raciocínio 29,564
Tempo de resposta (médio)17944ms
Tempo de resposta (total)233267ms
Tempo de resposta (máx.)100927ms

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Tempo de resposta (médio) Custo
Truques anti-IA 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Análise e extração de dados 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Específico do domínio 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Seguimento de instruções 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Modelos comparados

Comparar OpenAI: GPT-5.3-Codex com...

#5 · Google

Google: Gemini 3 Flash Preview

Raciocínio (low)

Score: 8.23

Consistência: 8.71

Taxa de acerto por tentativa: 82.0%

Testes instáveis: 2

Custo por resultado: 0.6173

Testes corretos:

Custo total: $0.06174

Comparar

#7 · OpenAI

OpenAI: GPT-5.2

Raciocínio (medium)

Score: 7.38

Consistência: 8.73

Taxa de acerto por tentativa: 76.9%

Testes instáveis: 2

Custo por resultado: 2.5637

Testes corretos:

Custo total: $0.23074

Comparar

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raciocínio (medium)

Score: 8.54

Consistência: 9.35

Taxa de acerto por tentativa: 87.2%

Testes instáveis: 1

Custo por resultado: 2.1621

Testes corretos:

Custo total: $0.23784

Comparar

Comparação rápida

Comparar OpenAI: GPT-5.3-Codex com...