AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5 Nano

Resumen

Comparación benchmark de DeepSeek V4 Flash vs GPT-5 Nano: GPT-5 Nano lidera en puntuación media con 6.3 vs 5.0. DeepSeek V4 Flash tiene menor coste de benchmark con $0.008 vs $0.081. DeepSeek V4 Flash es más rápido con 26.75s vs 42.51s, con tasas de acierto de 30.2% vs 57.1%.

Modelo recomendado: DeepSeek V4 Flash - Ofrece el mejor equilibrio general: puntuación competitiva (5.0), menor coste que GPT-5 Nano y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-04

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash none Lanzamiento: 2026-04-24	GPT-5 Nano GPT-5 Nano medium Lanzamiento: 2025-08-07

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash none Lanzamiento: 2026-04-24	GPT-5 Nano GPT-5 Nano medium Lanzamiento: 2025-08-07
Puntuación	5.0	6.3
Rango	#139	#94
Fiabilidad	10.0	10.0
Consistencia	8.9	7.3
Pruebas correctas
Tasa de aciertos por intento	30.2%	57.1%
Pruebas inestables	3	7
Ejecuciones totales	63	63
Costo por resultado	0.203	0.897
Costo total	$0.008	$0.081
Precio de entrada	$0.099 / 1M	$0.050 / 1M
Precio de salida	$0.197 / 1M	$0.400 / 1M
Total de tokens de entrada	50,127	34,108
Tokens de salida	13,710	5,464
Tokens de razonamiento	0	192,064
Tiempo de respuesta (promedio)	26.75s	42.51s
Tiempo de respuesta (máximo)	111.96s	204.02s
Tiempo de respuesta (total)	561.82s	595.09s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#139 DeepSeek V4 Flash

none

Cost: $0.004
Time: 157.6s
Tokens: 11,297 tok

#94 GPT-5 Nano

medium

Cost: $0.006
Time: 108.5s
Tokens: 13,209 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	540	174	0
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.2	7.4	11.1%	1		17.13s	7,279	9,717	0
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	24,398	2,664	0
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	7,290	195	0
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	666	18	0
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	471	67	0
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	627	321	0
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.1	7.3	11.1%	1		23.72s	594	207	0
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	8,079	327	0
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		3.07s	183	20	0
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144

Comparación rápida

Cambiar par de comparación

GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Ring-2.6-1TnonevsGPT-5 Nanomedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium Gemini 3.1 Flash LitenonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.7 Plusnone Gemini 3.1 Flash LiteminimalvsGPT-5 Nanomedium GPT-5 NanomediumvsGLM 5none Gemma 4 31BnoneDisponible gratisvsGPT-5 Nanomedium Gemma 4 26B A4BnoneDisponible gratisvsGPT-5 Nanomedium DeepSeek V4 ProhighvsGPT-5 Nanomedium DeepSeek V4 FlashnonevsMistral Small 4medium DeepSeek V4 FlashnonevsMiniMax M2.7medium