Claude Sonnet 4.6 vs Qwen3.6 Flash (medium)

Modelo recomendado Claude Sonnet 4.6

Tem a melhor pontuação aqui (7.3) e responde cerca de 5.5x mais rápido que Qwen3.6 Flash (medium).

Comparação detalhada

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lançamento: 2026-02-17	Qwen3.6 Flash Qwen3.6 Flash medium Lançamento: 2026-04-20

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lançamento: 2026-02-17	Qwen3.6 Flash Qwen3.6 Flash medium Lançamento: 2026-04-20
Pontuação	7.3	6.9
Posição	#71	#93
Confiabilidade	10.0	10.0
Consistência	9.7	8.2
Testes corretos
Taxa de acerto por tentativa	57.6%	68.2%
Testes instáveis	1	5
Execuções totais	66	66
Custo por resultado	5.502	6.784
Custo total	$0.661	$0.738
Preço de entrada	$3.000 / 1M	$0.188 / 1M
Preço de saída	$15.000 / 1M	$1.125 / 1M
Total de tokens de entrada	123,264	129,041
Tokens de saída	19,362	20,026
Tokens de raciocínio	0	614,312
Tempo de resposta (médio)	8.12s	44.65s
Tempo de resposta (máx.)	51.18s	578.13s
Tempo de resposta (total)	121.78s	982.32s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

SVG inválido

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.10s	672	624	14,024

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
Qwen3.6 Flash	5.0	5.1	44.5%	2		42.85s	7,895	495	67,967

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
Qwen3.6 Flash	6.5	10.0	50.0%	0		299.21s	101,613	17,514	382,793

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		9.65s	7,782	270	13,155

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
Qwen3.6 Flash	3.5	4.4	33.3%	2		14.65s	771	60	24,409

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
Qwen3.6 Flash	4.8	9.9	0.0%	0		9.88s	516	140	5,445

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.05s	699	102	7,423

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
Qwen3.6 Flash	8.2	7.2	88.9%	1		6.29s	696	460	10,860

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		4.00s	8,193	335	1,188

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
Qwen3.6 Flash	3.0	10.0	0.0%	0		122.87s	204	26	87,048

Trocar par de comparação