DeepSeek: DeepSeek V4 Flash vs Google: Gemini 2.5 Flash

Gemini 2.5 Flash (medium) lidera en puntuación media con 8.2 vs 7.7. DeepSeek V4 Flash (high) tiene menor coste de benchmark con $0.041 vs $0.643. Gemini 2.5 Flash (medium) es más rápido con 21.18s vs 49.75s, con tasas de acierto de 72.7% vs 71.2%.

Modelo recomendadoDeepSeek V4 Flash (high)Su puntuación se mantiene cerca de la mejor aquí (7.7 vs 8.2) y cuesta aproximadamente 16.0x menos que Gemini 2.5 Flash (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-25

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Gemini 2.5 Flash Gemini 2.5 Flash medium Lanzamiento: 2025-06-17

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Gemini 2.5 Flash Gemini 2.5 Flash medium Lanzamiento: 2025-06-17
Puntuación	7.7	8.2
Rango	#52	#31
Fiabilidad	10.0	10.0
Consistencia	8.2	9.6
Pruebas correctas
Tasa de aciertos por intento	72.7%	71.2%
Pruebas inestables	5	1
Ejecuciones totales	66	66
Costo por resultado	0.402	4.286
Costo total	$0.041	$0.643
Precio de entrada	$0.094 / 1M	$0.300 / 1M
Precio de salida	$0.188 / 1M	$2.500 / 1M
Total de tokens de entrada	108,392	132,498
Tokens de salida	14,478	12,739
Tokens de razonamiento	153,687	228,464
Tiempo de respuesta (promedio)	49.75s	21.18s
Tiempo de respuesta (máximo)	218.13s	140.50s
Tiempo de respuesta (total)	1094.41s	465.89s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Coste: $0.003
Tiempo: 93.1s
Tokens: 7,926 tok

#31 Gemini 2.5 Flash

medium

SVG inválido

Coste: $0.000
Tiempo: 274.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Gemini 2.5 Flash	8.4	10.0	75.0%	0		6.30s	492	255	10,233

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Gemini 2.5 Flash	7.8	10.0	66.7%	0		41.01s	6,669	543	32,303

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
Gemini 2.5 Flash	10.0	10.0	100.0%	0		84.47s	110,544	11,112	95,241

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Gemini 2.5 Flash	10.0	10.0	100.0%	0		4.06s	7,257	279	2,325

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Gemini 2.5 Flash	5.9	7.2	55.6%	1		37.34s	633	18	80,702

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Gemini 2.5 Flash	4.8	10.0	0.0%	0		4.86s	486	92	1,899

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Gemini 2.5 Flash	9.8	10.0	100.0%	0		2.62s	615	69	1,203

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Gemini 2.5 Flash	7.7	10.0	66.7%	0		3.18s	558	126	2,499

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Gemini 2.5 Flash	10.0	10.0	100.0%	0		6.20s	5,088	234	1,140

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Gemini 2.5 Flash	3.0	10.0	0.0%	0		2.76s	156	11	919

Comparación rápida

Cambiar par de comparación

Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Gemini 2.5 FlashmediumvsMuse Spark 1.1low DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 FlashhighvsGrok Build 0.1medium Claude Opus 4.8lowvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGPT-5.6 Lunamedium DeepSeek V4 FlashhighvsNemotron 3 UltramediumDisponible gratis Claude Opus 5nonevsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsKimi K2.7 Codemedium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium Gemini 2.5 FlashmediumvsMuse Spark 1.1high