AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Z.ai: GLM 5.2

Resumen

Comparación benchmark de Qwen3.5 Plus 2026-02-15 vs GLM 5.2: Qwen3.5 Plus 2026-02-15 lidera en puntuación media con 8.0 vs 7.1. GLM 5.2 tiene menor coste de benchmark con $0.052 vs $0.310. GLM 5.2 es más rápido con 6.34s vs 73.79s, con tasas de acierto de 73.0% vs 60.3%.

Modelo recomendado: GLM 5.2 - Ofrece el mejor equilibrio general: puntuación competitiva (7.1), menor coste que Qwen3.5 Plus 2026-02-15 y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15	GLM 5.2 GLM 5.2 none Lanzamiento: 2026-06-17

Métrica	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15	GLM 5.2 GLM 5.2 none Lanzamiento: 2026-06-17
Puntuación	8.0	7.1
Rango	#28	#61
Fiabilidad	10.0	9.9
Consistencia	8.8	9.6
Pruebas correctas
Tasa de aciertos por intento	73.0%	60.3%
Pruebas inestables	3	1
Ejecuciones totales	63	63
Costo por resultado	2.445	0.628
Costo total	$0.310	$0.052
Precio de entrada	$0.260 / 1M	$0.950 / 1M
Precio de salida	$1.560 / 1M	$3.000 / 1M
Total de tokens de entrada	40,918	38,671
Tokens de salida	2,159	4,817
Tokens de razonamiento	189,604	0
Tiempo de respuesta (promedio)	73.79s	6.34s
Tiempo de respuesta (máximo)	266.69s	20.69s
Tiempo de respuesta (total)	1033.07s	133.19s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium

Coste: $0.011
Tiempo: 125.5s
Tokens: 7,040 tok

#61 GLM 5.2

none

SVG inválido

Coste: $0.033
Tiempo: 87.7s
Tokens: 7,455 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	672	205	21,236
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	6.6	7.1	44.4%	1		180.70s	6,950	420	80,595
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	14,934	421	7,906
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	7,782	270	14,916
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	444	35	16,680
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	344	73	8,675
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	699	101	7,704
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		32.50s	696	301	13,853
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	8,193	309	909
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	204	24	17,130
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

Comparación rápida

Cambiar par de comparación

Gemma 4 26B A4BmediumDisponible gratisvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Kimi K2.7 CodemediumvsGLM 5.2none Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none DeepSeek V4 FlashhighvsQwen3.5 Plus 2026-02-15medium MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none Qwen3.5 Plus 2026-02-15mediumvsStep 3.7 Flashlow Gemini 3.5 FlashminimalvsGLM 5.2none DeepSeek V3.2mediumvsGLM 5.2none