AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5.1

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07
Puntuación	7.3	7.4
Rango	#68	#56
Fiabilidad	10.0	5.0
Consistencia	7.5	8.3
Pruebas correctas
Tasa de aciertos por intento	73.3%	71.7%
Pruebas inestables	6	4
Ejecuciones totales	60	60
Costo por resultado	4.865	2.382
Costo total	$0.536	$0.286
Precio de entrada	$0.139 / 1M	$0.980 / 1M
Precio de salida	$1.000 / 1M	$3.080 / 1M
Tokens de salida	31,242	11,511
Tokens de razonamiento	330,546	71,979
Tiempo de respuesta (promedio)	69.66s	33.45s
Tiempo de respuesta (máximo)	409.98s	172.60s
Tiempo de respuesta (total)	1393.17s	635.63s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	6.5	10.0	50.0%	0		244.54s	14,456	88,431
GLM 5.1	4.7	1.6	66.7%	2		145.56s	4,727	34,384

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	3,592	26,585
GLM 5.1	8.2	7.2	88.9%	1		31.64s	935	5,730

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	10,919	72,053
GLM 5.1	3.0	10.0	0.0%	0		29.40s	82	2,179

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash LitelowvsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Claude Opus 4.8nonevsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsQwen3.5-35B-A3Bmedium Step 3.7 FlashlowvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium Qwen3.5-35B-A3BmediumvsStep 3.7 Flashhigh Qwen3.5-35B-A3BmediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsGLM 5.1medium GPT-5.3 ChatnonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash LitelowvsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsGLM 5.1medium