Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs DeepSeek: DeepSeek V4 Pro

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica DeepSeek V3.2 DeepSeek V3.2 medium Lanzamiento: 2025-12-01 DeepSeek V4 Pro DeepSeek V4 Pro high Lanzamiento: 2026-04-24
Puntuación 7.0 6.6
Rango #71 #80
Fiabilidad 9.1 9.0
Consistencia 7.6 8.3
Pruebas correctas
Tasa de aciertos por intento 69.2% 66.7%
Pruebas inestables 6 4
Ejecuciones totales 60 60
Costo por resultado 0.334 1.927
Costo total $0.037 $0.212
Precio de entrada $0.252 / 1M $0.435 / 1M
Precio de salida $0.378 / 1M $0.870 / 1M
Tokens de salida 7,049 12,211
Tokens de razonamiento 68,203 53,774
Tiempo de respuesta (promedio) 53.21s 58.93s
Tiempo de respuesta (máximo) 189.03s 358.35s
Tiempo de respuesta (total) 1064.26s 1119.75s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
DeepSeek V4 Pro 7.4 10.0 75.0% 0 16.53s 71 3,617
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 640 21,230
DeepSeek V4 Pro 2.8 5.0 25.0% 1 51.77s 105 2,641
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 465 5,914
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
DeepSeek V4 Pro 8.8 10.0 100.0% 0 23.62s 229 1,710
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
DeepSeek V4 Pro 3.0 6.9 16.7% 1 205.66s 10,529 28,089
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
DeepSeek V4 Pro 7.4 7.2 88.9% 1 34.92s 106 3,835
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 53 3,807

Comparación rápida

Cambiar par de comparación