AI BENCHY Compare

Qwen: Qwen3.6 35B A3B vs Z.ai: GLM 4.7 Flash

Resumen

Comparación benchmark de Qwen3.6 35B A3B vs GLM 4.7 Flash: GLM 4.7 Flash lidera en puntuación media con 5.5 vs 4.6. GLM 4.7 Flash tiene menor coste de benchmark con $0.004 vs $0.031. GLM 4.7 Flash es más rápido con 2.86s vs 3.73s, con tasas de acierto de 30.2% vs 36.5%.

Modelo recomendado: GLM 4.7 Flash - Tiene la mejor puntuación aquí (5.5) y cuesta aproximadamente 9.1x menos que Qwen3.6 35B A3B.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-10

Métrica	Qwen3.6 35B A3B Qwen3.6 35B A3B none Lanzamiento: 2026-04-20	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19

Métrica	Qwen3.6 35B A3B Qwen3.6 35B A3B none Lanzamiento: 2026-04-20	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19
Puntuación	4.6	5.5
Rango	#154	#123
Fiabilidad	10.0	10.0
Consistencia	8.0	8.8
Pruebas correctas
Tasa de aciertos por intento	30.2%	36.5%
Pruebas inestables	5	3
Ejecuciones totales	63	63
Costo por resultado	0.754	0.056
Costo total	$0.031	$0.004
Precio de entrada	$0.140 / 1M	$0.060 / 1M
Precio de salida	$1.000 / 1M	$0.400 / 1M
Total de tokens de entrada	19,329	38,745
Tokens de salida	27,755	2,521
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	3.73s	2.86s
Tiempo de respuesta (máximo)	22.52s	7.05s
Tiempo de respuesta (total)	70.86s	40.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#154 Qwen3.6 35B A3B

none

Cost: $0.008
Time: 30.1s
Tokens: 6,317 tok

#123 GLM 4.7 Flash

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.6	7.6	16.7%	1		2.10s	696	1,571	0
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	555	438	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	5.5	10.0	33.3%	0		8.77s	7,911	11,161	0
GLM 4.7 Flash	4.3	10.0	0.0%	0		2.54s	7,256	650	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		3.22s	14,325	704	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		1.46s	7,788	248	0
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	7,107	196	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.5	4.4	33.3%	2		7.45s	781	11,381	0
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	687	19	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	4.4	3.0	33.3%	1		3.51s	520	1,545	0
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	477	134	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	6.2	5.8	66.7%	1		1.86s	709	1,264	0
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	636	62	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.2	9.9	0.0%	0		1.07s	714	573	0
GLM 4.7 Flash	6.4	10.0	33.3%	0		1.20s	609	97	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	6,907	212	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		414ms	210	12	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		692ms	186	9	0

Comparación rápida

Cambiar par de comparación

CobuddymediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGLM 4.7 Flashnone MiniMax M2.7mediumvsGLM 4.7 Flashnone Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsGLM 4.7 Flashnone Nemotron 3 SupermediumDisponible gratisvsGLM 4.7 Flashnone DeepSeek V4 ProhighvsGLM 4.7 Flashnone gpt-oss-120bmediumDisponible gratisvsGLM 4.7 Flashnone Mistral Small 4mediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsQwen3.6 35B A3Bnone MiniMax M2.5mediumvsQwen3.6 35B A3Bnone GPT-5 NanomediumvsGLM 4.7 Flashnone