AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5V Turbo

Resumo

Comparação benchmark Qwen3.5-35B-A3B vs GLM 5V Turbo: Qwen3.5-35B-A3B lidera na pontuação média com 6.3 vs 5.9. GLM 5V Turbo tem menor custo de benchmark com $0.052 vs $0.401. GLM 5V Turbo é mais rápido com 2.99s vs 72.57s, com taxas de acerto de 69.8% vs 38.1%.

Modelo recomendado: GLM 5V Turbo - A pontuação fica perto da melhor aqui (5.9 vs 6.3) e custa cerca de 7.8x menos que Qwen3.5-35B-A3B.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24	GLM 5V Turbo GLM 5V Turbo none Lançamento: 2026-04-01

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24	GLM 5V Turbo GLM 5V Turbo none Lançamento: 2026-04-01
Pontuação	6.3	5.9
Posição	#88	#110
Confiabilidade	10.0	10.0
Consistência	7.5	10.0
Testes corretos
Taxa de acerto por tentativa	69.8%	38.1%
Testes instáveis	6	0
Execuções totais	63	63
Custo por resultado	5.162	0.645
Custo total	$0.401	$0.052
Preço de entrada	$0.140 / 1M	$1.200 / 1M
Preço de saída	$1.000 / 1M	$4.000 / 1M
Total de tokens de entrada	42,196	37,100
Tokens de saída	40,630	1,766
Tokens de raciocínio	353,577	0
Tempo de resposta (médio)	72.57s	2.99s
Tempo de resposta (máx.)	409.98s	6.51s
Tempo de resposta (total)	1524.04s	62.74s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Qwen3.5-35B-A3B

medium

Cost: $0.009
Time: 71.4s
Tokens: 8,631 tok

#110 GLM 5V Turbo

none

Cost: $0.042
Time: 177.3s
Tokens: 10,434 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652
GLM 5V Turbo	4.8	10.0	25.0%	0		3.13s	555	281	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462
GLM 5V Turbo	5.5	10.0	33.3%	0		3.13s	7,256	360	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485
GLM 5V Turbo	3.0	10.0	0.0%	0		6.51s	12,708	276	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493
GLM 5V Turbo	10.0	10.0	100.0%	0		3.81s	7,107	204	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368
GLM 5V Turbo	5.3	10.0	33.3%	0		2.09s	687	24	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753
GLM 5V Turbo	4.6	10.0	0.0%	0		2.22s	477	114	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361
GLM 5V Turbo	6.5	10.0	50.0%	0		1.97s	636	60	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585
GLM 5V Turbo	5.3	10.0	33.3%	0		2.40s	609	210	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365
GLM 5V Turbo	10.0	10.0	100.0%	0		4.86s	6,879	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053
GLM 5V Turbo	3.0	10.0	0.0%	0		2.23s	186	15	0

Comparação rápida

Trocar par de comparação