OpenAI: GPT-5.5 vs Z.ai: GLM 5

GPT-5.5 (low) lidera en puntuación media con 9.3 vs 7.7. GLM 5 (medium) tiene menor coste de benchmark con $0.307 vs $1.253. GPT-5.5 (low) es más rápido con 10.13s vs 33.54s, con tasas de acierto de 86.4% vs 78.8%.

Modelo recomendadoGPT-5.5 (low)Tiene la mejor puntuación aquí (9.3) y responde aproximadamente 3.3x más rápido que GLM 5 (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-25

Métrica	GPT-5.5 GPT-5.5 low Lanzamiento: 2026-04-24	GLM 5 GLM 5 medium Lanzamiento: 2026-02-12

Métrica	GPT-5.5 GPT-5.5 low Lanzamiento: 2026-04-24	GLM 5 GLM 5 medium Lanzamiento: 2026-02-12
Puntuación	9.3	7.7
Rango	#9	#49
Fiabilidad	10.0	10.0
Consistencia	10.0	8.1
Pruebas correctas
Tasa de aciertos por intento	86.4%	78.8%
Pruebas inestables	0	4
Ejecuciones totales	66	63
Costo por resultado	6.594	1.668
Costo total	$1.253	$0.307
Precio de entrada	$5.000 / 1M	$0.950 / 1M
Precio de salida	$30.000 / 1M	$2.551 / 1M
Total de tokens de entrada	80,058	35,224
Tokens de salida	5,378	21,570
Tokens de razonamiento	23,040	102,996
Tiempo de respuesta (promedio)	10.13s	33.54s
Tiempo de respuesta (máximo)	56.19s	99.85s
Tiempo de respuesta (total)	222.82s	435.99s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

low

Coste: $0.068
Tiempo: 37.0s
Tokens: 2,339 tok

#49 GLM 5

medium

Coste: $0.005
Tiempo: 20.7s
Tokens: 2,068 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297
GLM 5	5.0	5.0	50.0%	0		28.96s	12,804	662	3,242

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Comparación rápida

Cambiar par de comparación

GPT-5.6 LunahighvsGLM 5medium Claude Opus 4.8lowvsGLM 5medium DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 ProhighvsGLM 5medium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 5highvsGPT-5.5low Claude Opus 5mediumvsGPT-5.5low Claude Opus 5nonevsGLM 5medium GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low GPT-5.3 ChatnonevsGLM 5medium