Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.4 Nano

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica Gemini 2.5 Flash Gemini 2.5 Flash none Lançamento: 2025-06-17 GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17
Posição #48 #28
Pontuação 5.9 7.4
Consistência 9.1 9.0
Custo por resultado 0.192 0.769
Custo total $0.012 $0.077
Testes corretos
Taxa de acerto por tentativa 41.2% 66.7%
Testes instáveis 2 2
Execuções totais 51 51
Tokens de saída 1,273 2,474
Tokens de raciocínio 0 54,516
Tempo de resposta (médio) 888ms 11.08s
Tempo de resposta (máx.) 4.39s 94.06s
Tempo de resposta (total) 15.10s 188.39s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 8.0 6.8 66.7% 1 672ms 70 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.7 10.0 33.3% 0 576ms 132 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Comparação rápida

Trocar par de comparação