Gemini 3.1 Flash Lite Preview vs gpt-oss-120b (medium)

Modelo recomendado Gemini 3.1 Flash Lite Preview

Tem a melhor pontuação aqui (6.4) e responde cerca de 13.9x mais rápido que gpt-oss-120b (medium).

Comparação detalhada

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	gpt-oss-120b gpt-oss-120b medium Lançamento: 2025-08-05

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	gpt-oss-120b gpt-oss-120b medium Lançamento: 2025-08-05
Pontuação	6.4	6.1
Posição	#116	#132
Confiabilidade	10.0	10.0
Consistência	9.7	8.0
Testes corretos
Taxa de acerto por tentativa	57.6%	50.0%
Testes instáveis	1	5
Execuções totais	66	66
Custo por resultado	0.431	0.221
Custo total	$0.052	$0.019
Preço de entrada	$0.250 / 1M	$0.037 / 1M
Preço de saída	$1.500 / 1M	$0.170 / 1M
Total de tokens de entrada	120,942	108,747
Tokens de saída	14,292	29,772
Tokens de raciocínio	0	68,044
Tempo de resposta (médio)	1.58s	21.91s
Tempo de resposta (máx.)	9.27s	68.16s
Tempo de resposta (total)	34.72s	328.70s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
gpt-oss-120b	6.5	10.0	50.0%	0		23.96s	81,198	10,453	22,883

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758

Trocar par de comparação