AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Inception: Mercury 2

Resumen

Comparación benchmark de Seed-2.0-Lite vs Mercury 2: Mercury 2 lidera en puntuación media con 6.6 vs 5.8. Seed-2.0-Lite tiene menor coste de benchmark con $0.019 vs $0.058. Mercury 2 es más rápido con 2.24s vs 2.49s, con tasas de acierto de 46.0% vs 54.0%.

Modelo recomendado: Seed-2.0-Lite - Ofrece el mejor equilibrio general: puntuación competitiva (5.8), menor coste que Mercury 2 y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-10

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Mercury 2 Mercury 2 medium Lanzamiento: 2026-02-24

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Mercury 2 Mercury 2 medium Lanzamiento: 2026-02-24
Puntuación	5.8	6.6
Rango	#111	#82
Fiabilidad	10.0	10.0
Consistencia	8.4	8.8
Pruebas correctas
Tasa de aciertos por intento	46.0%	54.0%
Pruebas inestables	4	3
Ejecuciones totales	63	63
Costo por resultado	0.228	0.578
Costo total	$0.019	$0.058
Precio de entrada	$0.250 / 1M	$0.250 / 1M
Precio de salida	$2.000 / 1M	$0.750 / 1M
Total de tokens de entrada	46,573	35,116
Tokens de salida	3,259	4,048
Tokens de razonamiento	0	61,219
Tiempo de respuesta (promedio)	2.49s	2.24s
Tiempo de respuesta (máximo)	6.70s	14.63s
Tiempo de respuesta (total)	52.26s	44.72s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#82 Mercury 2

medium

Cost: $0.002
Time: 2.1s
Tokens: 1,702 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Mercury 2	6.9	9.9	50.0%	0		1.12s	554	2,546	2,609

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Mercury 2	8.2	7.7	77.8%	1		2.04s	7,065	296	11,328

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Mercury 2	10.0	10.0	100.0%	0		3.28s	12,909	268	4,887

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Mercury 2	7.3	5.9	83.3%	1		1.11s	6,234	183	1,656

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Mercury 2	2.9	7.2	11.1%	1		6.48s	695	41	30,754

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Mercury 2	4.8	10.0	0.0%	0		821ms	456	137	542

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Mercury 2	10.0	10.0	100.0%	0		1.07s	340	14	958

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Mercury 2	5.4	10.0	33.3%	0		949ms	601	361	2,781

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Mercury 2	10.0	10.0	100.0%	0		1.89s	6,080	180	1,956

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Mercury 2	3.0	10.0	0.0%	0		2.58s	182	22	3,748

Comparación rápida

Cambiar par de comparación

Seed-2.0-LitenonevsNemotron 3 SupermediumDisponible gratis Gemma 4 31BnoneDisponible gratisvsMercury 2medium CobuddymediumvsSeed-2.0-Litenone Claude Sonnet 4.6nonevsMercury 2medium Gemini 3.1 Flash LiteminimalvsMercury 2medium Mercury 2mediumvsQwen3.7 Plusnone Mercury 2mediumvsQwen3.6 Max Previewnone Gemini 3.1 Flash LitenonevsMercury 2medium Mercury 2mediumvsGPT-5.5none Seed-2.0-LitenonevsDeepSeek V4 Prohigh Seed-2.0-Litenonevsgpt-oss-120bmediumDisponible gratis Mercury 2mediumvsStep 3.7 Flashhigh