Gemini 3.1 Flash Lite (low) vs gpt-oss-120b (medium)

Modelo recomendado gpt-oss-120b (medium)

A pontuação fica perto da melhor aqui (6.1 vs 6.5) e custa cerca de 33.1x menos que Gemini 3.1 Flash Lite (low).

Comparação detalhada

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Lançamento: 2026-05-08	gpt-oss-120b gpt-oss-120b medium Lançamento: 2025-08-05

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Lançamento: 2026-05-08	gpt-oss-120b gpt-oss-120b medium Lançamento: 2025-08-05
Pontuação	6.5	6.1
Posição	#118	#135
Confiabilidade	10.0	10.0
Consistência	9.2	8.0
Testes corretos
Taxa de acerto por tentativa	59.1%	50.0%
Testes instáveis	2	5
Execuções totais	66	66
Custo por resultado	5.170	0.221
Custo total	$0.621	$0.019
Preço de entrada	$0.250 / 1M	$0.037 / 1M
Preço de saída	$1.500 / 1M	$0.170 / 1M
Total de tokens de entrada	94,224	108,747
Tokens de saída	7,759	29,772
Tokens de raciocínio	390,126	68,044
Tempo de resposta (médio)	16.26s	21.91s
Tempo de resposta (máx.)	318.02s	68.16s
Tempo de resposta (total)	357.64s	328.70s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

medium

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	3.2	9.1	0.0%	0		161.25s	70,202	5,375	381,841
gpt-oss-120b	6.5	10.0	50.0%	0		23.96s	81,198	10,453	22,883

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758

Trocar par de comparação