Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Z.ai: GLM 5 Turbo

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15

Métrica Gemini 2.5 Flash Gemini 2.5 Flash none Lançamento: 2025-06-17 GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Posição #45 #20
Pontuação 6.1 7.9
Consistência 9.1 7.7
Custo por resultado 0.191 1.641
Custo total $0.012 $0.165
Testes corretos
Taxa de acerto por tentativa 43.8% 75.0%
Testes instáveis 2 5
Execuções totais 48 48
Tokens de saída 1,270 11,853
Tokens de raciocínio 0 35,095
Tempo de resposta (médio) 923ms 18.84s
Tempo de resposta (máx.) 4.39s 194.23s
Tempo de resposta (total) 14.78s 301.50s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 3.0 10.0 0.0% 0 668ms 99 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 8.0 6.8 66.7% 1 672ms 70 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 5.7 10.0 33.3% 0 576ms 132 0
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

Comparação rápida

Trocar par de comparação