AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5.1

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24	GLM 5.1 GLM 5.1 medium Lançamento: 2026-04-07
Pontuação	7.3	7.4
Posição	#68	#56
Confiabilidade	10.0	5.0
Consistência	7.5	8.3
Testes corretos
Taxa de acerto por tentativa	73.3%	71.7%
Testes instáveis	6	4
Execuções totais	60	60
Custo por resultado	4.865	2.382
Custo total	$0.536	$0.286
Preço de entrada	$0.139 / 1M	$0.980 / 1M
Preço de saída	$1.000 / 1M	$3.080 / 1M
Tokens de saída	31,242	11,511
Tokens de raciocínio	330,546	71,979
Tempo de resposta (médio)	69.66s	33.45s
Tempo de resposta (máx.)	409.98s	172.60s
Tempo de resposta (total)	1393.17s	635.63s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	6.5	10.0	50.0%	0		244.54s	14,456	88,431
GLM 5.1	4.7	1.6	66.7%	2		145.56s	4,727	34,384

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	3,592	26,585
GLM 5.1	8.2	7.2	88.9%	1		31.64s	935	5,730

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	10,919	72,053
GLM 5.1	3.0	10.0	0.0%	0		29.40s	82	2,179

Comparação rápida

Trocar par de comparação

Gemini 3.1 Flash LitelowvsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Claude Opus 4.8nonevsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsQwen3.5-35B-A3Bmedium Step 3.7 FlashlowvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium Qwen3.5-35B-A3BmediumvsStep 3.7 Flashhigh Qwen3.5-35B-A3BmediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsGLM 5.1medium GPT-5.3 ChatnonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash LitelowvsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsGLM 5.1medium