Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.7 Max

Qwen3.7 Max lidera na pontuação média com 7.4 vs 7.3. Gemini 3.1 Flash Lite Preview (medium) tem menor custo de benchmark com $0.115 vs $0.197. Qwen3.7 Max é mais rápido com 4.52s vs 4.61s, com taxas de acerto de 59.1% vs 68.2%.

Modelo recomendadoGemini 3.1 Flash Lite Preview (medium)A pontuação fica perto da melhor aqui (7.3 vs 7.4) e custa cerca de 1.7x menos que Qwen3.7 Max.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-17

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.7 Max Qwen3.7 Max none Lançamento: 2026-05-22

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03	Qwen3.7 Max Qwen3.7 Max none Lançamento: 2026-05-22
Pontuação	7.3	7.4
Posição	#61	#57
Confiabilidade	10.0	9.9
Consistência	9.9	10.0
Testes corretos
Taxa de acerto por tentativa	59.1%	68.2%
Testes instáveis	0	0
Execuções totais	66	66
Custo por resultado	0.884	1.582
Custo total	$0.115	$0.197
Preço de entrada	$0.250 / 1M	$1.475 / 1M
Preço de saída	$1.500 / 1M	$4.425 / 1M
Total de tokens de entrada	117,480	95,983
Tokens de saída	10,589	12,446
Tokens de raciocínio	46,394	0
Tempo de resposta (médio)	4.61s	4.52s
Tempo de resposta (máx.)	18.34s	72.30s
Tempo de resposta (total)	101.39s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemini 3.1 Flash Lite Preview

medium

Custo: $0.003
Tempo: 5.2s
Tokens: 1,944 tok

#57 Qwen3.7 Max

none

Custo: $0.046
Tempo: 195.0s
Tokens: 12,171 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	512	570	4,305
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		4.09s	8,126	461	8,597
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.2	9.1	50.0%	0		16.63s	93,097	8,706	16,997
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	7,362	279	2,952
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	639	18	5,325
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	488	96	1,488
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	621	72	2,121
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		5.30s	566	141	1,896
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	5,909	234	912
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		2.68s	160	12	1,801
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Comparação rápida

Trocar par de comparação

Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 4.8nonevsGemini 3.1 Flash Lite Previewmedium GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5low Gemini 3.1 Flash Lite PreviewmediumvsStep 3.7 Flashlow Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone GPT-5.4 NanomediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5high Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumDisponível grátisvsQwen3.7 Maxnone