ByteDance Seed: Seed-2.0-Mini vs MoonshotAI: Kimi K2.5

La puntuación media está prácticamente empatada en 7.0 vs 7.0. Seed-2.0-Mini (medium) tiene menor coste de benchmark con $0.101 vs $0.600. Seed-2.0-Mini (medium) es más rápido con 92.53s vs 99.00s, con tasas de acierto de 57.6% vs 65.2%.

Modelo recomendadoSeed-2.0-Mini (medium)Tiene la mejor puntuación aquí (7.0) y cuesta aproximadamente 5.9x menos que Kimi K2.5 (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-17

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14	Kimi K2.5 Kimi K2.5 medium Lanzamiento: 2026-01-27

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14	Kimi K2.5 Kimi K2.5 medium Lanzamiento: 2026-01-27
Puntuación	7.0	7.0
Rango	#77	#74
Fiabilidad	8.5	10.0
Consistencia	8.9	7.0
Pruebas correctas
Tasa de aciertos por intento	57.6%	65.2%
Pruebas inestables	3	8
Ejecuciones totales	66	66
Costo por resultado	0.917	4.789
Costo total	$0.101	$0.600
Precio de entrada	$0.100 / 1M	$0.571 / 1M
Precio de salida	$0.400 / 1M	$2.850 / 1M
Total de tokens de entrada	125,467	118,448
Tokens de salida	10,778	62,124
Tokens de razonamiento	209,856	165,243
Tiempo de respuesta (promedio)	92.53s	99.00s
Tiempo de respuesta (máximo)	301.78s	281.00s
Tiempo de respuesta (total)	1665.50s	1485.04s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#77 Seed-2.0-Mini

medium

Coste: $0.002
Tiempo: 161.7s
Tokens: 4,379 tok

#74 MoonshotAI: Kimi K2.5

medium

Coste: $0.030
Tiempo: 58.6s
Tokens: 8,683 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
Kimi K2.5	7.3	5.8	83.3%	2		51.38s	634	2,789	8,880

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
Kimi K2.5	6.1	4.6	66.7%	2		217.49s	6,935	5,705	74,693

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	7.3	5.8	83.3%	1		282.30s	100,096	8,627	143,688
Kimi K2.5	6.7	9.1	50.0%	0		89.19s	95,416	14,448	11,209

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
Kimi K2.5	10.0	10.0	100.0%	0		49.78s	7,020	563	7,940

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
Kimi K2.5	3.5	4.4	33.3%	2		137.29s	485	20,753	30,564

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
Kimi K2.5	6.5	3.4	66.7%	1		69.73s	480	3,815	4,262

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
Kimi K2.5	10.0	10.0	100.0%	0		92.47s	675	5,371	6,547

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
Kimi K2.5	5.3	7.3	44.4%	1		43.23s	659	8,426	12,692

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
Kimi K2.5	10.0	10.0	100.0%	0		31.74s	5,933	242	812

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
Kimi K2.5	3.0	10.0	0.0%	0		83.95s	211	12	7,644

Comparación rápida

Cambiar par de comparación

Gemini 3.5 FlashnonevsKimi K2.5medium Seed-2.0-MinimediumvsGemini 3.5 Flashnone Seed-2.0-MinimediumvsDeepSeek V4 Pronone Seed-2.0-MinimediumvsGPT-5.6 Solnone DeepSeek V4 PrononevsKimi K2.5medium Kimi K2.5mediumvsGPT-5.6 Solnone Seed-2.0-MinimediumvsStep 3.7 Flashhigh Seed-2.0-MinimediumvsGPT-5.5none Kimi K2.5mediumvsStep 3.7 Flashhigh Kimi K2.5mediumvsGPT-5.5none Seed-2.0-MinimediumvsGemini 3.5 Flashminimal Kimi K2.5mediumvsQwen3.7 Plusnone