AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.5-Flash Qwen3.5-Flash medium Lançamento: 2026-02-24

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.5-Flash Qwen3.5-Flash medium Lançamento: 2026-02-24
Posição	#14	#19
Pontuação	8.1	8.0
Consistência	10.0	7.6
Custo por resultado	0.413	0.688
Custo total	$0.050	$0.076
Testes corretos
Taxa de acerto por tentativa	70.6%	82.4%
Testes instáveis	0	5
Execuções totais	51	51
Tokens de saída	1,737	1,827
Tokens de raciocínio	26,346	179,299
Tempo de resposta (médio)	3.70s	67.96s
Tempo de resposta (máx.)	14.93s	234.29s
Tempo de resposta (total)	62.97s	1155.28s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
Qwen3.5-Flash	10.0	10.0	100.0%	0		59.11s	383	32,992

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
Qwen3.5-Flash	10.0	10.0	100.0%	0		17.78s	483	8,270

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
Qwen3.5-Flash	7.3	5.9	83.3%	1		56.99s	235	16,237

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
Qwen3.5-Flash	5.3	7.2	44.4%	1		146.50s	58	43,615

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
Qwen3.5-Flash	6.1	3.1	66.7%	1		40.05s	99	38,486

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
Qwen3.5-Flash	10.0	10.0	100.0%	0		63.49s	98	14,139

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
Qwen3.5-Flash	6.4	4.4	77.8%	2		56.74s	162	24,276

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
Qwen3.5-Flash	10.0	10.0	100.0%	0		10.33s	309	1,284

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone GPT-5.3 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Qwen3.5-FlashmediumvsGLM 5none Gemini 3.1 Flash Lite PreviewmediumvsQwen3.5 Plus 2026-02-15none