AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

Z.ai: GLM 4.7 Flash

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica Z.ai: GLM 4.7 Flash
Rango#20
EmpresaZ.ai
Score 3.92
Consistencia 6.51
Costo por resultado 0.2253
Costo total $0.00902
Pruebas correctas 4/12
Tasa de aciertos por intento 50.0%
Pruebas inestables 5
Tokens de salida 7,601
Tokens de razonamiento 18,390

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

Modelos comparados

Comparar Z.ai: GLM 4.7 Flash contra...

#19 · OpenAI

OpenAI: GPT-4o-mini

Sin razonamiento

Score: 4.00

Consistencia: 9.98

Tasa de aciertos por intento: 25.0%

Pruebas inestables: 0

Costo por resultado: 0.0576

Pruebas correctas: 3/12

Costo total: $0.00173

Comparar

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Razonamiento (medium)

Score: 3.92

Consistencia: 7.89

Tasa de aciertos por intento: 44.4%

Pruebas inestables: 3

Costo por resultado: 0.4829

Pruebas correctas: 4/12

Costo total: $0.01932

Comparar

#18 · Stepfun

StepFun: Step 3.5 Flash

Razonamiento (medium)

Score: 4.92

Consistencia: 7.34

Tasa de aciertos por intento: 58.3%

Pruebas inestables: 4

Costo por resultado: 0.0000

Pruebas correctas: 5/12

Costo total: $0.00000

Comparar

Comparación rápida

Comparar Z.ai: GLM 4.7 Flash contra...