AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.6 35B A3B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-08

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20
Pontuação	8.0	8.0
Posição	#23	#21
Confiabilidade	10.0	9.8
Consistência	10.0	9.1
Testes corretos
Taxa de acerto por tentativa	68.4%	74.5%
Testes instáveis	0	2
Execuções totais	57	57
Custo por resultado	0.440	0.959
Custo total	$0.058	$0.116
Preço de entrada	$0.250 / 1M	$0.150 / 1M
Preço de saída	$1.500 / 1M	$1.000 / 1M
Tokens de saída	2,180	15,018
Tokens de raciocínio	30,831	108,331
Tempo de resposta (médio)	3.68s	13.22s
Tempo de resposta (máx.)	14.93s	45.02s
Tempo de resposta (total)	69.99s	224.66s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	1,154	12,385

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		4.34s	431	2,684
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		32.58s	3,294	15,116

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	2,591	9,968

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	6,193	39,116

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	129	4,569

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	219	7,404

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
Qwen3.6 35B A3B	7.9	7.5	77.8%	1		5.98s	676	9,447

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		2.68s	12	1,801
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		32.90s	762	10,326

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewnonevsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone GPT-5.2 ChatnonevsQwen3.6 35B A3Bmedium DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash LitelowvsQwen3.6 35B A3Bmedium GPT-5.3 ChatnonevsQwen3.6 35B A3Bmedium DeepSeek V4 FlashhighvsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewmediumvsQwen3.6 Max Previewnone Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium