AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Mistral: Mistral Small 4

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-11

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16
Puntuación	6.1	5.7
Rango	#61	#69
Consistencia	8.1	6.8
Pruebas correctas
Tasa de aciertos por intento	50.0%	50.0%
Pruebas inestables	4	7
Ejecuciones totales	54	54
Costo por resultado	0.226	0.674
Costo total	$0.016	$0.034
Precio de entrada	$0.260 / 1M	$0.150 / 1M
Precio de salida	$0.380 / 1M	$0.600 / 1M
Tokens de salida	8,384	15,084
Tokens de razonamiento	0	39,408
Tiempo de respuesta (promedio)	12.09s	5.64s
Tiempo de respuesta (máximo)	115.89s	30.49s
Tiempo de respuesta (total)	217.56s	101.52s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Mistral Small 4	6.7	3.5	66.7%	1		30.49s	2,796	11,296

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810

Comparación rápida

Cambiar par de comparación

Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsGLM 5.1none Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsGLM 5 Turbonone DeepSeek V3.2nonevsGPT-5 Nanomedium Mistral Small 4mediumvsQwen3.5-27Bnone Mistral Small 4mediumvsGPT-5.4none DeepSeek V3.2nonevsgpt-oss-120bmediumDisponible gratis Trinity Large PreviewnoneDisponible gratisvsMistral Small 4medium Mistral Small 4mediumvsMiMo-V2-Pronone DeepSeek V3.2nonevsMercury 2medium