AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15

Métrica	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lançamento: 2026-02-15	GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15

Métrica	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lançamento: 2026-02-15	GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Posição	#35	#20
Pontuação	7.0	7.9
Consistência	9.6	7.7
Custo por resultado	0.172	1.641
Custo total	$0.016	$0.165
Testes corretos
Taxa de acerto por tentativa	58.3%	75.0%
Testes instáveis	1	5
Execuções totais	48	48
Tokens de saída	2,015	11,853
Tokens de raciocínio	0	35,095
Tempo de resposta (médio)	2.65s	18.84s
Tempo de resposta (máx.)	6.65s	194.23s
Tempo de resposta (total)	26.52s	301.50s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		2.74s	514	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.01s	350	2,600

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.82s	516	0
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.3 ChatnonevsGLM 5 Turbomedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium Nemotron 3 Super 120b A12bmediumDisponível grátisvsQwen3.5 Plus 2026-02-15none Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Claude Opus 4.6mediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGLM 5 Turbomedium