Qwen3.7 Plus vs Step 3.7 Flash (high)

Modelo recomendado Qwen3.7 Plus

Tiene la mejor puntuación aquí (7.2) y cuesta aproximadamente 11.4x menos que Step 3.7 Flash (high).

Comparación detallada

Métrica	Qwen3.7 Plus Qwen3.7 Plus none Lanzamiento: 2026-06-03	Step 3.7 Flash Step 3.7 Flash high Lanzamiento: 2026-05-29

Métrica	Qwen3.7 Plus Qwen3.7 Plus none Lanzamiento: 2026-06-03	Step 3.7 Flash Step 3.7 Flash high Lanzamiento: 2026-05-29
Puntuación	7.2	6.9
Rango	#79	#94
Fiabilidad	10.0	10.0
Consistencia	10.0	8.0
Pruebas correctas
Tasa de aciertos por intento	50.0%	63.6%
Pruebas inestables	0	5
Ejecuciones totales	66	66
Costo por resultado	1.014	10.973
Costo total	$0.106	$1.207
Precio de entrada	$0.320 / 1M	$0.200 / 1M
Precio de salida	$1.280 / 1M	$1.150 / 1M
Total de tokens de entrada	98,824	98,691
Tokens de salida	58,097	1,032,395
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	12.09s	64.68s
Tiempo de respuesta (máximo)	206.03s	364.99s
Tiempo de respuesta (total)	265.89s	1423.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

high

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0

Cambiar par de comparación