AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Z.ai: GLM 5.1

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-30

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lanzamiento: 2026-03-17	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lanzamiento: 2026-03-17	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07
Puntuación	7.6	7.8
Rango	#50	#45
Fiabilidad	N/D	N/D
Consistencia	9.0	8.6
Pruebas correctas
Tasa de aciertos por intento	68.5%	75.9%
Pruebas inestables	2	3
Ejecuciones totales	54	54
Costo por resultado	0.747	1.674
Costo total	$0.083	$0.201
Precio de entrada	$0.200 / 1M	$1.050 / 1M
Precio de salida	$1.250 / 1M	$3.500 / 1M
Tokens de salida	2,946	8,005
Tokens de razonamiento	58,132	49,090
Tiempo de respuesta (promedio)	11.21s	24.13s
Tiempo de respuesta (máximo)	94.06s	118.52s
Tiempo de respuesta (total)	201.80s	410.25s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	10.0	10.0	100.0%	0		13.41s	472	3,616
GLM 5.1	4.7	1.6	66.7%	1		118.52s	1,339	13,777

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Comparación rápida

Cambiar par de comparación

GPT-5.4 NanomediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighvsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Qwen3.6 Max PreviewnonevsGLM 5.1medium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium Gemini 3 Flash PreviewnonevsGLM 5.1medium HY3 PreviewlowDisponible gratisvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium