Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-24

Métrica Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14 DeepSeek V4 Pro DeepSeek V4 Pro high Lanzamiento: 2026-04-24
Puntuación 8.6 8.2
Rango #7 #20
Fiabilidad N/D N/D
Consistencia 8.8 9.6
Pruebas correctas
Tasa de aciertos por intento 83.3% 74.1%
Pruebas inestables 3 1
Ejecuciones totales 54 24
Costo por resultado 0.926 1.224
Costo total $0.121 $0.160
Precio de entrada $0.250 / 1M $1.740 / 1M
Precio de salida $2.000 / 1M $3.480 / 1M
Tokens de salida 3,257 671
Tokens de razonamiento 52,042 39,383
Tiempo de respuesta (promedio) 30.37s 71.21s
Tiempo de respuesta (máximo) 168.71s 351.99s
Tiempo de respuesta (total) 546.72s 1281.73s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173

Comparación rápida

Cambiar par de comparación