AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash minimal Lançamento: 2026-05-19	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lançamento: 2026-02-15

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash minimal Lançamento: 2026-05-19	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lançamento: 2026-02-15
Pontuação	8.1	8.2
Posição	#21	#16
Confiabilidade	10.0	10.0
Consistência	9.6	9.1
Testes corretos
Taxa de acerto por tentativa	75.4%	79.0%
Testes instáveis	1	2
Execuções totais	57	57
Custo por resultado	0.494	1.758
Custo total	$0.070	$0.247
Preço de entrada	$1.500 / 1M	$0.260 / 1M
Preço de saída	$9.000 / 1M	$1.560 / 1M
Tokens de saída	2,262	2,145
Tokens de raciocínio	0	129,019
Tempo de resposta (médio)	1.37s	51.33s
Tempo de resposta (máx.)	3.56s	120.91s
Tempo de resposta (total)	26.04s	616.01s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	405	0
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.28s	441	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		120.91s	367	19,367

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	3.0	10.0	0.0%	0		3.56s	404	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	279	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	12	0
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	117	0
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	76	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	282	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		34.57s	340	14,496

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	234	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	12	0
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	24	17,130

Comparação rápida

Trocar par de comparação

Gemini 3.5 FlashminimalvsQwen3.5-27Bmedium Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Gemini 3.5 FlashminimalvsGLM 5medium Gemini 3.5 FlashminimalvsGLM 5 Turbomedium Gemini 3.5 FlashminimalvsQwen3.6 35B A3Bmedium Gemini 3.5 FlashminimalvsGPT-5.3-Codexmedium Seed-2.0-LitemediumvsGemini 3.5 Flashminimal Gemini 3.5 FlashminimalvsGrok 4.3medium Gemini 3.5 FlashminimalvsGPT-5.4medium Gemini 3.5 FlashminimalvsQwen3.6 Plusmedium Gemini 3.5 FlashminimalvsQwen3.5-122B-A10Bmedium Gemini 3.5 FlashminimalvsMiMo-V2.5medium