AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-24

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	GPT-5.5 GPT-5.5 medium Lançamento: 2026-04-24

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	GPT-5.5 GPT-5.5 medium Lançamento: 2026-04-24
Pontuação	8.2	9.0
Posição	#19	#5
Confiabilidade	N/D	N/D
Consistência	10.0	9.2
Testes corretos
Taxa de acerto por tentativa	72.2%	87.0%
Testes instáveis	0	2
Execuções totais	54	54
Custo por resultado	0.419	19.226
Custo total	$0.055	$2.884
Preço de entrada	$0.250 / 1M	$5.000 / 1M
Preço de saída	$1.500 / 1M	$30.000 / 1M
Tokens de saída	2,168	1,920
Tokens de raciocínio	29,030	89,632
Tempo de resposta (médio)	3.74s	32.75s
Tempo de resposta (máx.)	14.93s	332.10s
Tempo de resposta (total)	67.31s	589.59s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		4.34s	431	2,684
GPT-5.5	10.0	10.0	100.0%	0		9.09s	318	1,391

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
GPT-5.5	8.6	7.9	77.8%	1		6.78s	250	2,254

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832

Comparação rápida

Trocar par de comparação

DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewlowDisponível grátis Gemini 3 Flash PreviewlowvsGPT-5.5medium Claude Opus 4.7nonevsGPT-5.5medium Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewhighDisponível grátis Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewmedium GPT-5.5mediumvsHY3 PreviewhighDisponível grátis Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium DeepSeek V4 ProhighvsGPT-5.5medium GPT-5.5mediumvsHY3 PreviewlowDisponível grátis