Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Z.ai: GLM 5 Turbo

Resumo

Comparação benchmark GPT-5.2 Chat vs GLM 5 Turbo: GPT-5.2 Chat lidera na pontuação média com 8.5 vs 8.4. GLM 5 Turbo tem menor custo de benchmark com $0.323 vs $0.393. GPT-5.2 Chat é mais rápido com 7.13s vs 23.00s, com taxas de acerto de 74.6% vs 74.6%.

Modelo recomendado: GPT-5.2 Chat - Tem a melhor pontuação aqui (8.5) e responde cerca de 3.2x mais rápido que GLM 5 Turbo.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica GPT-5.2 Chat GPT-5.2 Chat none Lançamento: 2025-12-11 GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Pontuação 8.5 8.4
Posição #22 #24
Confiabilidade 10.0 10.0
Consistência 8.9 8.5
Testes corretos
Taxa de acerto por tentativa 74.6% 74.6%
Testes instáveis 3 4
Execuções totais 63 63
Custo por resultado 2.803 2.011
Custo total $0.393 $0.323
Preço de entrada $1.750 / 1M $1.200 / 1M
Preço de saída $14.000 / 1M $4.000 / 1M
Total de tokens de entrada 34,212 35,593
Tokens de saída 23,744 12,245
Tokens de raciocínio 0 62,277
Tempo de resposta (médio) 7.13s 23.00s
Tempo de resposta (máx.) 38.52s 194.23s
Tempo de resposta (total) 149.69s 482.97s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2 Chat

none
Cost
$0.010
Time
15.3s
Tokens
797 tok

#24 GLM 5 Turbo

medium
Cost
$0.074
Time
206.0s
Tokens
18,549 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 555 362 3,137
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
GLM 5 Turbo 8.2 9.3 66.7% 0 45.90s 5,941 363 25,381
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 12,714 390 2,037
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 7,107 577 3,632
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 489 9,665 19,279
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 477 60 2,216
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 636 255 2,183
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
GLM 5 Turbo 8.7 7.9 77.8% 1 5.23s 609 312 2,647
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 6,879 241 446
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 186 20 1,319

Comparação rápida

Trocar par de comparação