Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15

Métrica Qwen3.5-Flash Qwen3.5-Flash none Lançamento: 2026-02-24 GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Posição #42 #20
Pontuação 6.2 7.9
Consistência 9.6 7.7
Custo por resultado 0.077 1.641
Custo total $0.006 $0.165
Testes corretos
Taxa de acerto por tentativa 45.8% 75.0%
Testes instáveis 1 5
Execuções totais 48 48
Tokens de saída 3,774 11,853
Tokens de raciocínio 0 35,095
Tempo de resposta (médio) 3.54s 18.84s
Tempo de resposta (máx.) 13.73s 194.23s
Tempo de resposta (total) 56.70s 301.50s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 3.7 7.8 11.1% 1 1.62s 687 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

Comparação rápida

Trocar par de comparação