AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Xiaomi: MiMo-V2-Omni

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-29

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18
Puntuación	8.6	6.5
Rango	#10	#72
Fiabilidad	N/D	N/D
Consistencia	8.8	10.0
Pruebas correctas
Tasa de aciertos por intento	83.3%	44.4%
Pruebas inestables	3	0
Ejecuciones totales	54	20
Costo por resultado	0.926	0.083
Costo total	$0.121	$0.007
Precio de entrada	$0.250 / 1M	$0.400 / 1M
Precio de salida	$2.000 / 1M	$2.000 / 1M
Tokens de salida	3,257	868
Tokens de razonamiento	52,042	0
Tiempo de respuesta (promedio)	30.37s	1.99s
Tiempo de respuesta (máximo)	168.71s	6.81s
Tiempo de respuesta (total)	546.72s	35.81s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparación rápida

Cambiar par de comparación

Mercury 2mediumvsMiMo-V2-Omninone Seed-2.0-LitemediumvsHY3 PreviewhighDisponible gratis Laguna M.1mediumDisponible gratisvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Nemotron 3 SupermediumDisponible gratisvsMiMo-V2-Omninone Laguna Xs.2mediumDisponible gratisvsMiMo-V2-Omninone DeepSeek V4 ProhighvsMiMo-V2-Omninone Seed-2.0-LitemediumvsGPT-5.5low Seed-2.0-LitemediumvsHY3 PreviewlowDisponible gratis Seed-2.0-LitemediumvsGemini 3 Flash Previewnone