Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica	Google: Gemini 3.1 Flash Lite Preview high Lançamento: 2026-03-03	OpenAI: GPT-5.4 medium Lançamento: 2026-03-05
Pontuação média	8.1	8.2
Testes corretos
Posição	#10	#7
Consistência	9.6	8.9
Custo por resultado	20.937	6.533
Custo total	$2.303	$0.784
Taxa de acerto por tentativa	75.6%	86.7%
Testes instáveis	1	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokens de saída	1,166	1,611
Tokens de raciocínio	1,529,395	46,321
Tempo de resposta (médio)	73.07s	21.06s
Tempo de resposta (máx.)	280.52s	100.41s
Tempo de resposta (total)	1096.07s	315.95s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		43.87s	144	193,077
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		5.02s	216	1,466

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		280.52s	335	380,440
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		20.57s	301	3,543

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.9	10.0	100.0%	0		7.16s	279	6,186
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		5.32s	234	804

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	4.0	10.0	33.3%	0		127.58s	18	566,202
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		74.27s	61	34,748

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.0	6.9	66.7%	1		70.07s	69	190,053
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		3.11s	93	897

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	7.0	10.0	66.7%	0		46.33s	87	190,953
OpenAI: GPT-5.4	7.0	7.2	88.9%	1		9.13s	442	3,832

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		7.73s	234	2,484
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		13.28s	264	1,031

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewlowvsGPT-5.4medium Gemini 3.1 Flash Lite PreviewhighvsQwen3.5-122B-A10Bmedium Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewhighvsQwen3.5-27Bmedium DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewhigh Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewhigh Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4medium Gemini 3.1 Flash Lite PreviewhighvsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewhighvsStep 3.5 FlashmediumDisponível grátis Gemini 3.1 Flash Lite PreviewhighvsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewhighvsGLM 5medium Gemini 3.1 Flash Lite PreviewhighvsGPT-5.3 Chatnone