Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.3-Codex

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lançamento: 2025-12-17 GPT-5.3-Codex GPT-5.3-Codex medium Lançamento: 2026-02-05
Pontuação 9.8 8.3
Posição #1 #17
Confiabilidade 10.0 10.0
Consistência 9.6 8.4
Testes corretos
Taxa de acerto por tentativa 98.3% 81.7%
Testes instáveis 1 4
Execuções totais 60 60
Custo por resultado 2.980 4.887
Custo total $0.567 $0.685
Preço de entrada $0.500 / 1M $1.750 / 1M
Preço de saída $3.000 / 1M $14.000 / 1M
Tokens de saída 2,000 2,336
Tokens de raciocínio 181,033 42,565
Tempo de resposta (médio) 16.50s 15.95s
Tempo de resposta (máx.) 117.26s 100.93s
Tempo de resposta (total) 330.06s 319.08s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 456 127,964
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 183 4,365
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 356 1,593
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701

Comparação rápida

Trocar par de comparação