DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5 Mini

GPT-5 Mini (medium) lidera en puntuación media con 8.1 vs 7.7. DeepSeek V4 Flash (high) tiene menor coste de benchmark con $0.042 vs $0.237. GPT-5 Mini (medium) es más rápido con 27.63s vs 49.75s, con tasas de acierto de 72.7% vs 63.6%.

Modelo recomendadoDeepSeek V4 Flash (high)Su puntuación se mantiene cerca de la mejor aquí (7.7 vs 8.1) y cuesta aproximadamente 5.6x menos que GPT-5 Mini (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-17

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Lanzamiento: 2025-08-07

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Lanzamiento: 2025-08-07
Puntuación	7.7	8.1
Rango	#43	#26
Fiabilidad	10.0	10.0
Consistencia	8.2	8.8
Pruebas correctas
Tasa de aciertos por intento	72.7%	63.6%
Pruebas inestables	5	3
Ejecuciones totales	66	66
Costo por resultado	0.402	1.971
Costo total	$0.042	$0.237
Precio de entrada	$0.098 / 1M	$0.250 / 1M
Precio de salida	$0.196 / 1M	$2.000 / 1M
Total de tokens de entrada	108,392	98,374
Tokens de salida	14,478	14,434
Tokens de razonamiento	153,687	91,498
Tiempo de respuesta (promedio)	49.75s	27.63s
Tiempo de respuesta (máximo)	218.13s	111.48s
Tiempo de respuesta (total)	1094.41s	607.92s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#43 DeepSeek V4 Flash

high

Coste: $0.003
Tiempo: 93.1s
Tokens: 7,926 tok

#26 GPT-5 Mini

medium

Coste: $0.007
Tiempo: 42.9s
Tokens: 3,432 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GPT-5 Mini	7.3	5.8	83.3%	1		99.82s	75,392	8,387	35,328

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856

Comparación rápida

Cambiar par de comparación

Muse Spark 1.1highvsGPT-5 Minimedium Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium GPT-5 MinimediumvsGLM 5.2high DeepSeek V4 FlashhighvsGrok Build 0.1medium Claude Opus 4.8lowvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGPT-5.6 Lunamedium DeepSeek V4 FlashhighvsNemotron 3 UltramediumDisponible gratis Kimi K3maxvsGPT-5 Minimedium DeepSeek V4 FlashhighvsKimi K2.7 Codemedium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium