AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.4 Nano

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-01

Métrica	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lançamento: 2026-02-19	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17

Métrica	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lançamento: 2026-02-19	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17
Pontuação	9.6	7.6
Posição	#2	#51
Confiabilidade	N/D	N/D
Consistência	10.0	9.0
Testes corretos
Taxa de acerto por tentativa	94.4%	68.5%
Testes instáveis	0	2
Execuções totais	54	54
Custo por resultado	3.400	0.747
Custo total	$0.578	$0.083
Preço de entrada	$2.000 / 1M	$0.200 / 1M
Preço de saída	$12.000 / 1M	$1.250 / 1M
Tokens de saída	1,932	2,946
Tokens de raciocínio	40,542	58,132
Tempo de resposta (médio)	15.96s	11.21s
Tempo de resposta (máx.)	40.61s	94.06s
Tempo de resposta (total)	175.52s	201.80s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
GPT-5.4 Nano	10.0	10.0	100.0%	0		13.41s	472	3,616

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382

Comparação rápida

Trocar par de comparação

GPT-5.4 NanomediumvsQwen3.6 Max Previewnone Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Nanomedium Gemini 3 Flash PreviewnonevsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsHY3 PreviewlowDisponível grátis DeepSeek V4 ProhighvsGPT-5.4 Nanomedium Gemma 4 31BnoneDisponível grátisvsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15none