Qwen3.7 Max vs Step 3.7 Flash (high)

Modelo recomendado Qwen3.7 Max

Tiene la mejor puntuación aquí (7.4) y cuesta aproximadamente 6.1x menos que Step 3.7 Flash (high).

Comparación detallada

Métrica	Qwen3.7 Max Qwen3.7 Max none Lanzamiento: 2026-05-22	Step 3.7 Flash Step 3.7 Flash high Lanzamiento: 2026-05-29

Métrica	Qwen3.7 Max Qwen3.7 Max none Lanzamiento: 2026-05-22	Step 3.7 Flash Step 3.7 Flash high Lanzamiento: 2026-05-29
Puntuación	7.4	6.9
Rango	#67	#94
Fiabilidad	9.9	10.0
Consistencia	10.0	8.0
Pruebas correctas
Tasa de aciertos por intento	68.2%	63.6%
Pruebas inestables	0	5
Ejecuciones totales	66	66
Costo por resultado	1.582	10.973
Costo total	$0.197	$1.207
Precio de entrada	$1.475 / 1M	$0.200 / 1M
Precio de salida	$4.425 / 1M	$1.150 / 1M
Total de tokens de entrada	95,983	98,691
Tokens de salida	12,446	1,032,395
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	4.52s	64.68s
Tiempo de respuesta (máximo)	72.30s	364.99s
Tiempo de respuesta (total)	99.52s	1423.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

high

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0

Cambiar par de comparación