Qwen3.6 35B A3B (medium) vs Step 3.7 Flash (high)

Modelo recomendado Qwen3.6 35B A3B (medium)

A pontuação fica perto da melhor aqui (6.7 vs 6.9) e custa cerca de 1.6x menos que Step 3.7 Flash (high).

Comparação detalhada

Métrica	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20	Step 3.7 Flash Step 3.7 Flash high Lançamento: 2026-05-29

Métrica	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20	Step 3.7 Flash Step 3.7 Flash high Lançamento: 2026-05-29
Pontuação	6.7	6.9
Posição	#98	#94
Confiabilidade	10.0	10.0
Consistência	9.6	8.0
Testes corretos
Taxa de acerto por tentativa	60.6%	63.6%
Testes instáveis	1	5
Execuções totais	66	66
Custo por resultado	5.712	10.973
Custo total	$0.746	$1.207
Preço de entrada	$0.140 / 1M	$0.200 / 1M
Preço de saída	$1.000 / 1M	$1.150 / 1M
Total de tokens de entrada	85,139	98,691
Tokens de saída	61,819	1,032,395
Tokens de raciocínio	678,766	0
Tempo de resposta (médio)	58.06s	64.68s
Tempo de resposta (máx.)	817.57s	364.99s
Tempo de resposta (total)	1161.18s	1423.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

SVG inválido

high

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	672	1,154	12,385
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	7.7	10.0	66.7%	0		50.55s	5,051	7,929	37,223
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		817.57s	68,754	42,187	548,547
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	7,776	2,591	9,968
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	771	6,193	39,116
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	516	129	4,569
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	699	219	7,404
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	8.0	10.0	66.7%	0		5.95s	696	655	9,228
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		32.90s	204	762	10,326
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0

Trocar par de comparação