AI BENCHY
Comparar
❤️ Made by XCS

Nome do modelo

Z.ai: GLM 4.7 Flash

Benchmarks gerados a partir das suítes de teste do Aibenchy em : 19 de fev. de 2026

Métrica Z.ai: GLM 4.7 Flash
Posição#23
EmpresaZ.ai
Score 3.25
Consistência 8.75
Custo por resultado 0.0351
Custo total $0.00071
Testes corretos 2/12
Taxa de acerto por tentativa 27.8%
Testes instáveis 2
Tokens de saída 399
Tokens de raciocínio 0

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Custo
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00003
Data parsing and extraction 0/2 0.50 5.81 33.3% 1 - $0.00050
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00005
Instructions following 0/2 4.00 6.84 33.3% 1 - $0.00006
Puzzle Solving 0/3 2.33 9.91 0.0% 0 - $0.00008

Modelos comparados

Comparar Z.ai: GLM 4.7 Flash com...

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

Sem raciocínio

Score: 3.42

Consistência: 9.28

Taxa de acerto por tentativa: 30.6%

Testes instáveis: 1

Custo por resultado: 0.2049

Testes corretos: 3/12

Custo total: $0.00615

Comparar

#24 · X Ai

xAI: Grok 4.1 Fast

Sem raciocínio

Score: 3.25

Consistência: 9.17

Taxa de acerto por tentativa: 30.6%

Testes instáveis: 1

Custo por resultado: 0.1074

Testes corretos: 3/12

Custo total: $0.00323

Comparar

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Raciocínio (medium)

Score: 3.92

Consistência: 7.89

Taxa de acerto por tentativa: 44.4%

Testes instáveis: 3

Custo por resultado: 0.4829

Testes corretos: 4/12

Custo total: $0.01932

Comparar

Comparação rápida

Comparar Z.ai: GLM 4.7 Flash com...