AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

Z.ai: GLM 4.7 Flash

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica Z.ai: GLM 4.7 Flash
Rango#23
EmpresaZ.ai
Score 3.25
Consistencia 8.75
Costo por resultado 0.0351
Costo total $0.00071
Pruebas correctas 2/12
Tasa de aciertos por intento 27.8%
Pruebas inestables 2
Tokens de salida 399
Tokens de razonamiento 0

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00003
Data parsing and extraction 0/2 0.50 5.81 33.3% 1 - $0.00050
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00005
Instructions following 0/2 4.00 6.84 33.3% 1 - $0.00006
Puzzle Solving 0/3 2.33 9.91 0.0% 0 - $0.00008

Modelos comparados

Comparar Z.ai: GLM 4.7 Flash contra...

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

Sin razonamiento

Score: 3.42

Consistencia: 9.28

Tasa de aciertos por intento: 30.6%

Pruebas inestables: 1

Costo por resultado: 0.2049

Pruebas correctas: 3/12

Costo total: $0.00615

Comparar

#24 · X Ai

xAI: Grok 4.1 Fast

Sin razonamiento

Score: 3.25

Consistencia: 9.17

Tasa de aciertos por intento: 30.6%

Pruebas inestables: 1

Costo por resultado: 0.1074

Pruebas correctas: 3/12

Costo total: $0.00323

Comparar

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Razonamiento (medium)

Score: 3.92

Consistencia: 7.89

Tasa de aciertos por intento: 44.4%

Pruebas inestables: 3

Costo por resultado: 0.4829

Pruebas correctas: 4/12

Costo total: $0.01932

Comparar

Comparación rápida

Comparar Z.ai: GLM 4.7 Flash contra...