AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5V Turbo

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-03

Métrica	GPT-5.4 GPT-5.4 none Lanzamiento: 2026-03-05	GLM 5V Turbo GLM 5V Turbo none Lanzamiento: 2026-04-01

Métrica	GPT-5.4 GPT-5.4 none Lanzamiento: 2026-03-05	GLM 5V Turbo GLM 5V Turbo none Lanzamiento: 2026-04-01
Puntuación	5.6	5.9
Rango	#121	#105
Fiabilidad	10.0	10.0
Consistencia	9.1	10.0
Pruebas correctas
Tasa de aciertos por intento	38.3%	40.0%
Pruebas inestables	2	0
Ejecuciones totales	60	60
Costo por resultado	1.644	0.606
Costo total	$0.116	$0.049
Precio de entrada	$2.500 / 1M	$1.200 / 1M
Precio de salida	$15.000 / 1M	$4.000 / 1M
Total de tokens de entrada	31,593	34,502
Tokens de salida	2,402	1,760
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	1.45s	3.04s
Tiempo de respuesta (máximo)	2.95s	6.51s
Tiempo de respuesta (total)	29.00s	60.88s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0
GLM 5V Turbo	4.8	10.0	25.0%	0		3.13s	555	281	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	6.8	10.0	50.0%	0		1.99s	4,686	501	0
GLM 5V Turbo	6.8	10.0	50.0%	0		3.77s	4,658	354	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	3.0	10.0	0.0%	0		2.89s	11,019	291	0
GLM 5V Turbo	3.0	10.0	0.0%	0		6.51s	12,708	276	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0
GLM 5V Turbo	10.0	10.0	100.0%	0		3.81s	7,107	204	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.09s	687	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0
GLM 5V Turbo	4.6	10.0	0.0%	0		2.22s	477	114	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0
GLM 5V Turbo	6.5	10.0	50.0%	0		1.97s	636	60	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.40s	609	210	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0
GLM 5V Turbo	10.0	10.0	100.0%	0		4.86s	6,879	222	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0
GLM 5V Turbo	3.0	10.0	0.0%	0		2.23s	186	15	0

Comparación rápida

Cambiar par de comparación

gpt-oss-120bmediumDisponible gratisvsGLM 5V Turbonone Nemotron 3 SupermediumDisponible gratisvsGLM 5V Turbonone Owl AlphamediumvsGLM 5V Turbonone MiniMax M2.5mediumvsGPT-5.4none CobuddymediumvsGLM 5V Turbonone CobuddymediumvsGPT-5.4none DeepSeek V4 ProhighvsGLM 5V Turbonone MiniMax M2.7mediumvsGPT-5.4none Mistral Small 4mediumvsGPT-5.4none GPT-5 NanomediumvsGLM 5V Turbonone GPT-5.4nonevsOwl Alphamedium GPT-5.4nonevsElephant Alphamedium