Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15

Métrica GPT-5.2 Chat GPT-5.2 Chat none Lançamento: 2025-12-11 GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Posição #17 #20
Pontuação 8.0 7.9
Consistência 9.1 7.7
Custo por resultado 2.440 1.641
Custo total $0.269 $0.165
Testes corretos
Taxa de acerto por tentativa 75.0% 75.0%
Testes instáveis 2 5
Execuções totais 48 48
Tokens de saída 15,845 11,853
Tokens de raciocínio 0 35,095
Tempo de resposta (médio) 7.03s 18.84s
Tempo de resposta (máx.) 38.52s 194.23s
Tempo de resposta (total) 112.51s 301.50s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

Comparação rápida

Trocar par de comparação