Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-25

Métrica Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14 DeepSeek V4 Pro DeepSeek V4 Pro none Lanzamiento: 2026-04-24
Puntuación 6.2 6.7
Rango #71 #61
Fiabilidad N/D 0.0
Consistencia 7.7 9.5
Pruebas correctas
Tasa de aciertos por intento 55.6% 51.9%
Pruebas inestables 5 1
Ejecuciones totales 54 26
Costo por resultado 0.200 0.327
Costo total $0.016 $0.030
Precio de entrada $0.250 / 1M $1.740 / 1M
Precio de salida $2.000 / 1M $3.480 / 1M
Tokens de salida 3,129 1,611
Tokens de razonamiento 0 0
Tiempo de respuesta (promedio) 2.53s 23.34s
Tiempo de respuesta (máximo) 6.70s 109.46s
Tiempo de respuesta (total) 45.46s 420.04s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
DeepSeek V4 Pro 4.8 10.0 25.0% 0 36.12s 221 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 33.40s 246 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
DeepSeek V4 Pro 9.5 10.0 100.0% 0 34.55s 826 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 54.04s 65 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.08s 12 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
DeepSeek V4 Pro 4.5 10.0 0.0% 0 6.06s 45 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
DeepSeek V4 Pro 6.5 10.0 50.0% 0 9.47s 25 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
DeepSeek V4 Pro 6.0 7.1 44.4% 1 19.60s 98 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 6.47s 73 0

Comparación rápida

Cambiar par de comparación