AI BENCHY Compare

Qwen: Qwen3.6 27B vs Z.ai: GLM 5

Resumo

Comparação benchmark Qwen3.6 27B vs GLM 5: Qwen3.6 27B lidera na pontuação média com 6.6 vs 6.0. GLM 5 tem menor custo de benchmark com $0.027 vs $0.430. GLM 5 é mais rápido com 4.03s vs 59.71s, com taxas de acerto de 60.3% vs 44.4%.

Modelo recomendado: GLM 5 - A pontuação fica perto da melhor aqui (6.0 vs 6.6) e custa cerca de 16.5x menos que Qwen3.6 27B.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica	Qwen3.6 27B Qwen3.6 27B medium Lançamento: 2026-04-20	GLM 5 GLM 5 none Lançamento: 2026-02-12

Métrica	Qwen3.6 27B Qwen3.6 27B medium Lançamento: 2026-04-20	GLM 5 GLM 5 none Lançamento: 2026-02-12
Pontuação	6.6	6.0
Posição	#80	#106
Confiabilidade	10.0	10.0
Consistência	8.2	9.7
Testes corretos
Taxa de acerto por tentativa	60.3%	44.4%
Testes instáveis	5	1
Execuções totais	63	63
Custo por resultado	3.361	0.263
Custo total	$0.430	$0.027
Preço de entrada	$0.288 / 1M	$0.600 / 1M
Preço de saída	$3.100 / 1M	$1.920 / 1M
Total de tokens de entrada	39,376	37,135
Tokens de saída	16,189	1,989
Tokens de raciocínio	122,521	0
Tempo de resposta (médio)	59.71s	4.03s
Tempo de resposta (máx.)	168.22s	11.07s
Tempo de resposta (total)	1254.01s	56.37s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#80 Qwen3.6 27B

medium

Cost: $0.009
Time: 39.6s
Tokens: 3,090 tok

#106 GLM 5

none

Cost: $0.007
Time: 32.1s
Tokens: 2,023 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311
GLM 5	4.8	10.0	25.0%	0		2.37s	510	275	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367
GLM 5	4.0	7.8	11.1%	1		5.12s	7,256	428	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	15,104	2,088	14,689
GLM 5	3.0	10.0	0.0%	0		4.98s	12,812	406	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404
GLM 5	10.0	10.0	100.0%	0		5.78s	7,107	203	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352
GLM 5	3.0	10.0	0.0%	0		2.24s	643	19	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045
GLM 5	10.0	10.0	100.0%	0		3.27s	477	103	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548
GLM 5	10.0	10.0	100.0%	0		1.48s	636	61	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044
GLM 5	7.7	10.0	66.7%	0		1.91s	609	261	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954
GLM 5	10.0	10.0	100.0%	0		11.07s	6,899	220	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807
GLM 5	3.0	10.0	0.0%	0		3.62s	186	13	0

Comparação rápida

Trocar par de comparação

Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium Gemini 3.1 Flash LitelowvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsGLM 5none Gemini 3.5 FlashminimalvsQwen3.6 27Bmedium DeepSeek V4 ProhighvsGLM 5none GPT-5.5nonevsQwen3.6 27Bmedium DeepSeek V4 ProhighvsQwen3.6 27Bmedium Gemini 3 Flash PreviewnonevsQwen3.6 27Bmedium Qwen3.5-35B-A3BmediumvsGLM 5none DeepSeek V4 PrononevsQwen3.6 27Bmedium Gemma 4 31BmediumDisponível grátisvsGLM 5none