AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Qwen: Qwen3.6 Max Preview

Resumen

Comparación benchmark de GPT-5.4 Nano vs Qwen3.6 Max Preview: GPT-5.4 Nano lidera en puntuación media con 7.0 vs 6.9. Qwen3.6 Max Preview tiene menor coste de benchmark con $0.075 vs $0.107. Qwen3.6 Max Preview es más rápido con 3.30s vs 11.95s, con tasas de acierto de 63.5% vs 58.7%.

Modelo recomendado: Qwen3.6 Max Preview - Su puntuación se mantiene cerca de la mejor aquí (6.9 vs 7.0) y responde aproximadamente 3.6x más rápido que GPT-5.4 Nano.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-10

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lanzamiento: 2026-03-17	Qwen3.6 Max Preview Qwen3.6 Max Preview none Lanzamiento: 2026-04-20

Métrica	GPT-5.4 Nano GPT-5.4 Nano medium Lanzamiento: 2026-03-17	Qwen3.6 Max Preview Qwen3.6 Max Preview none Lanzamiento: 2026-04-20
Puntuación	7.0	6.9
Rango	#71	#75
Fiabilidad	10.0	10.0
Consistencia	8.4	9.2
Pruebas correctas
Tasa de aciertos por intento	63.5%	58.7%
Pruebas inestables	4	2
Ejecuciones totales	63	63
Costo por resultado	0.969	0.824
Costo total	$0.107	$0.075
Precio de entrada	$0.200 / 1M	$1.040 / 1M
Precio de salida	$1.250 / 1M	$6.240 / 1M
Total de tokens de entrada	35,434	42,509
Tokens de salida	3,014	4,779
Tokens de razonamiento	76,520	0
Tiempo de respuesta (promedio)	11.95s	3.30s
Tiempo de respuesta (máximo)	94.06s	20.51s
Tiempo de respuesta (total)	250.98s	69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 GPT-5.4 Nano

medium

Cost: $0.007
Time: 24.6s
Tokens: 4,943 tok

#75 Qwen3.6 Max Preview

none

Cost: $0.025
Time: 83.9s
Tokens: 4,066 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	606	683	2,254
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	696	513	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	6.1	4.7	66.7%	2		19.12s	7,305	516	20,778
Qwen3.6 Max Preview	3.8	7.3	22.2%	1		3.12s	7,913	456	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	12,345	349	5,719
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	14,949	2,842	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	7,140	234	516
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	7,794	243	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	619	60	43,325
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	789	18	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	477	179	443
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	522	76	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	660	95	521
Qwen3.6 Max Preview	9.8	10.0	100.0%	0		1.40s	711	69	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	4.1	7.2	22.2%	1		3.79s	642	594	1,408
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.65s	714	321	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	5,445	234	382
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	8,211	222	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.4 Nano	3.0	10.0	0.0%	0		4.81s	195	70	1,174
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		1.97s	210	19	0

Comparación rápida

Cambiar par de comparación

GPT-5.4 NanomediumvsStep 3.7 Flashhigh Claude Opus 4.8nonevsGPT-5.4 Nanomedium Ring-2.6-1TmediumvsQwen3.6 Max Previewnone Seed-2.0-MinimediumvsQwen3.6 Max Previewnone Kimi K2.5mediumvsQwen3.6 Max Previewnone DeepSeek V3.2mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsStep 3.7 Flashhigh Claude Opus 4.6mediumvsQwen3.6 Max Previewnone MiniMax M3mediumvsQwen3.6 Max Previewnone Gemini 3.1 Flash LitelowvsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsStep 3.7 Flashlow