Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-27B vs Z.ai: GLM 5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-02

Métrica Qwen3.5-27B Qwen3.5-27B medium Lançamento: 2026-02-24 GLM 5 GLM 5 medium Lançamento: 2026-02-12
Pontuação 7.9 8.2
Posição #27 #19
Confiabilidade 10.0 10.0
Consistência 8.9 8.4
Testes corretos
Taxa de acerto por tentativa 73.3% 81.7%
Testes instáveis 3 4
Execuções totais 60 60
Custo por resultado 4.532 1.676
Custo total $0.488 $0.228
Preço de entrada $0.195 / 1M $0.600 / 1M
Preço de saída $1.560 / 1M $2.080 / 1M
Total de tokens de entrada 39,329 32,626
Tokens de saída 2,569 21,558
Tokens de raciocínio 304,894 95,772
Tempo de resposta (médio) 60.09s 32.67s
Tempo de resposta (máx.) 177.36s 99.85s
Tempo de resposta (total) 1201.89s 392.01s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 7.0 9.8 50.0% 0 123.86s 5,060 416 64,993
GLM 5 10.0 10.0 100.0% 0 89.47s 4,656 2,985 45,706
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Comparação rápida

Trocar par de comparação