Qwen3.7 Plus vs GLM 5.1 (medium)

Modelo recomendado Qwen3.7 Plus

Tiene la mejor puntuación aquí (7.2) y cuesta aproximadamente 5.0x menos que GLM 5.1 (medium).

Comparación detallada

Métrica	Qwen3.7 Plus Qwen3.7 Plus none Lanzamiento: 2026-06-03	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07

Métrica	Qwen3.7 Plus Qwen3.7 Plus none Lanzamiento: 2026-06-03	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07
Puntuación	7.2	7.1
Rango	#79	#82
Fiabilidad	10.0	8.3
Consistencia	10.0	8.4
Pruebas correctas
Tasa de aciertos por intento	50.0%	69.7%
Pruebas inestables	0	4
Ejecuciones totales	66	66
Costo por resultado	1.014	4.202
Costo total	$0.106	$0.535
Precio de entrada	$0.320 / 1M	$0.966 / 1M
Precio de salida	$1.280 / 1M	$3.036 / 1M
Total de tokens de entrada	98,824	82,623
Tokens de salida	58,097	16,089
Tokens de razonamiento	0	136,463
Tiempo de respuesta (promedio)	12.09s	46.77s
Tiempo de respuesta (máximo)	206.03s	308.75s
Tiempo de respuesta (total)	265.89s	982.16s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

SVG inválido

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
GLM 5.1	9.8	10.0	100.0%	0		175.93s	66,926	4,761	65,248

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Cambiar par de comparación