AI BENCHY Compare

Qwen: Qwen3 Coder Next vs Z.ai: GLM 4.7 Flash

Resumen

Comparación benchmark de Qwen3 Coder Next vs GLM 4.7 Flash: Qwen3 Coder Next lidera en puntuación media con 5.1 vs 4.3. Qwen3 Coder Next tiene menor coste de benchmark con $0.009 vs $0.054. Qwen3 Coder Next es más rápido con 8.62s vs 35.10s, con tasas de acierto de 27.0% vs 33.3%.

Modelo recomendado: Qwen3 Coder Next - Tiene la mejor puntuación aquí (5.1) y cuesta aproximadamente 6.6x menos que GLM 4.7 Flash.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-02

Métrica	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash medium Lanzamiento: 2026-01-19

Métrica	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash medium Lanzamiento: 2026-01-19
Puntuación	5.1	4.3
Rango	#135	#162
Fiabilidad	10.0	6.7
Consistencia	9.7	6.8
Pruebas correctas
Tasa de aciertos por intento	27.0%	33.3%
Pruebas inestables	1	8
Ejecuciones totales	63	63
Costo por resultado	0.165	1.337
Costo total	$0.009	$0.054
Precio de entrada	$0.110 / 1M	$0.060 / 1M
Precio de salida	$0.800 / 1M	$0.400 / 1M
Total de tokens de entrada	47,507	37,206
Tokens de salida	3,584	43,754
Tokens de razonamiento	0	89,079
Tiempo de respuesta (promedio)	8.62s	35.10s
Tiempo de respuesta (máximo)	45.14s	174.55s
Tiempo de respuesta (total)	129.37s	456.24s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#135 Qwen3 Coder Next

none

SVG inválido

Coste: $0.058
Tiempo: 246.3s
Tokens: 64,126 tok

#162 GLM 4.7 Flash

medium

SVG inválido

Coste: $0.000
Tiempo: 186.2s
Tokens: 12,112 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	4.6	7.9	22.2%	1		2.22s	7,442	621	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	20,469	317	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	17,185	2,585	20,648

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Comparación rápida

Cambiar par de comparación

Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Grok 4.20nonevsGLM 4.7 Flashmedium CobuddymediumvsQwen3 Coder Nextnone Granite 4.1 8BnonevsGLM 4.7 Flashmedium gpt-oss-120bnoneDisponible gratisvsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsQwen3 Coder Nextnone Ling-2.6-1TnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Ring-2.6-1TnonevsGLM 4.7 Flashmedium Ling-2.6-flashnonevsGLM 4.7 Flashmedium