Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.3 Chat

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica Gemini 3.5 Flash Gemini 3.5 Flash medium Lançamento: 2026-05-19 GPT-5.3 Chat GPT-5.3 Chat none Lançamento: 2026-03-03
Pontuação 9.2 7.6
Posição #5 #51
Confiabilidade 10.0 10.0
Consistência 10.0 8.7
Testes corretos
Taxa de acerto por tentativa 89.5% 70.2%
Testes instáveis 0 3
Execuções totais 57 57
Custo por resultado 2.307 2.895
Custo total $0.393 $0.348
Preço de entrada $1.500 / 1M $1.750 / 1M
Preço de saída $9.000 / 1M $14.000 / 1M
Tokens de saída 1,971 21,353
Tokens de raciocínio 36,659 0
Tempo de resposta (médio) 3.90s 5.80s
Tempo de resposta (máx.) 12.05s 18.33s
Tempo de resposta (total) 74.13s 110.27s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.09s 171 3,385
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 8.22s 431 5,190
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 12.05s 351 7,807
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 4.07s 279 3,784
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 7.7 10.0 66.7% 0 5.24s 12 8,047
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 115 1,144
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 9.9 10.0 100.0% 0 2.70s 71 2,855
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.29s 1,455 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 7.7 10.0 66.7% 0 2.38s 295 2,747
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.81s 234 455
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.75s 12 1,245
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0

Comparação rápida

Trocar par de comparação