AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite

Resumen

Comparación benchmark de DeepSeek V3.2 vs Gemini 3.1 Flash Lite: DeepSeek V3.2 lidera en puntuación media con 7.5 vs 6.1. Gemini 3.1 Flash Lite tiene menor coste de benchmark con $0.013 vs $0.044. Gemini 3.1 Flash Lite es más rápido con 1.33s vs 68.71s, con tasas de acierto de 65.1% vs 54.0%.

Modelo recomendado: Gemini 3.1 Flash Lite - Ofrece el mejor equilibrio general: puntuación competitiva (6.1), menor coste que DeepSeek V3.2 y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lanzamiento: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lanzamiento: 2026-05-08

Métrica	DeepSeek V3.2 DeepSeek V3.2 medium Lanzamiento: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lanzamiento: 2026-05-08
Puntuación	7.5	6.1
Rango	#48	#94
Fiabilidad	10.0	10.0
Consistencia	7.6	8.8
Pruebas correctas
Tasa de aciertos por intento	65.1%	54.0%
Pruebas inestables	6	3
Ejecuciones totales	63	63
Costo por resultado	0.436	0.130
Costo total	$0.044	$0.013
Precio de entrada	$0.229 / 1M	$0.250 / 1M
Precio de salida	$0.344 / 1M	$1.500 / 1M
Total de tokens de entrada	38,333	36,973
Tokens de salida	7,186	2,487
Tokens de razonamiento	99,081	0
Tiempo de respuesta (promedio)	68.71s	1.33s
Tiempo de respuesta (máximo)	376.10s	4.49s
Tiempo de respuesta (total)	1442.81s	27.91s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 DeepSeek V3.2

medium

Coste: $0.001
Tiempo: 53.6s
Tokens: 1,932 tok

#94 Gemini 3.1 Flash Lite

minimal

Coste: $0.001
Tiempo: 3.7s
Tokens: 635 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	500	639	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		831ms	8,126	666	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.53s	12,870	357	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	7,552	279	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	641	15	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	490	63	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	615	72	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	564	153	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	5,457	234	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	158	9	0

Comparación rápida

Cambiar par de comparación