AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3 Coder Next

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03
Puntuación	5.7	5.2
Rango	#111	#128
Fiabilidad	10.0	10.0
Consistencia	7.9	9.7
Pruebas correctas
Tasa de aciertos por intento	49.1%	29.8%
Pruebas inestables	5	1
Ejecuciones totales	57	57
Costo por resultado	0.218	0.151
Costo total	$0.016	$0.008
Precio de entrada	$0.252 / 1M	$0.110 / 1M
Precio de salida	$0.378 / 1M	$0.800 / 1M
Tokens de salida	7,194	3,629
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	13.43s	9.44s
Tiempo de respuesta (máximo)	115.89s	45.14s
Tiempo de respuesta (total)	255.10s	122.73s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.3	8.2	12.5%	1		9.35s	1,073	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.0	6.9	16.7%	1		4.17s	21	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	7.6	10.0	100.0%	0		9.32s	43	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.71s	63	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	7.5	7.7	88.9%	1		7.13s	302	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		22.86s	652	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	12	0

Comparación rápida

Cambiar par de comparación

MiniMax M2.7mediumvsQwen3 Coder Nextnone DeepSeek V3.2nonevsgpt-oss-120bmediumDisponible gratis DeepSeek V3.2nonevsMiniMax M2.5mediumDisponible gratis DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V3.2nonevsElephant Alphamedium CobuddymediumDisponible gratisvsDeepSeek V3.2none Elephant AlphamediumvsQwen3 Coder Nextnone DeepSeek V3.2nonevsOwl Alphamedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumDisponible gratisvsQwen3 Coder Nextnone DeepSeek V3.2nonevsNemotron 3 SupermediumDisponible gratis DeepSeek V3.2nonevsMiniMax M2.7medium