Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs MoonshotAI: Kimi K2.5

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-12

Métrica Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14 Kimi K2.5 Kimi K2.5 medium Lanzamiento: 2026-01-27
Rango #45 #30
Puntaje prom. 4.9 6.4
Consistencia 7.4 7.5
Costo por resultado 0.214 2.171
Costo total $0.015 $0.196
Pruebas correctas
Tasa de aciertos por intento 56.3% 72.9%
Pruebas inestables 5 5
Ejecuciones totales 48 48
Tokens de salida 2,743 38,453
Tokens de razonamiento 0 72,496
Tiempo de respuesta (promedio) 2.49s 69.83s
Tiempo de respuesta (máximo) 6.70s 137.29s
Tiempo de respuesta (total) 39.91s 628.45s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntaje prom. vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Kimi K2.5 7.0 7.2 88.9% 1 85.28s 335 6,255
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Kimi K2.5 9.9 10.0 100.0% 0 49.78s 563 7,940
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Kimi K2.5 10.0 4.4 33.3% 2 137.29s 20,753 30,564
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Kimi K2.5 6.0 3.4 66.7% 1 69.73s 3,815 4,262
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Kimi K2.5 4.0 7.3 44.4% 1 45.40s 6,671 12,403
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812

Comparación rápida

Cambiar par de comparación