AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs inclusionAI: Ling-2.6-flash

Resumen

Comparación benchmark de Seed-2.0-Lite vs Ling-2.6-flash: Seed-2.0-Lite lidera en puntuación media con 5.8 vs 5.0. Ling-2.6-flash tiene menor coste de benchmark con $0.001 vs $0.019. Seed-2.0-Lite es más rápido con 2.49s vs 9.34s, con tasas de acierto de 46.0% vs 31.8%.

Modelo recomendado: Ling-2.6-flash - Su puntuación se mantiene cerca de la mejor aquí (5.0 vs 5.8) y cuesta aproximadamente 36.8x menos que Seed-2.0-Lite.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-04

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21
Puntuación	5.8	5.0
Rango	#110	#138
Fiabilidad	10.0	10.0
Consistencia	8.4	9.2
Pruebas correctas
Tasa de aciertos por intento	46.0%	31.8%
Pruebas inestables	4	2
Ejecuciones totales	63	63
Costo por resultado	0.228	0.005
Costo total	$0.019	$0.001
Precio de entrada	$0.250 / 1M	$0.010 / 1M
Precio de salida	$2.000 / 1M	$0.030 / 1M
Total de tokens de entrada	46,573	40,718
Tokens de salida	3,259	2,878
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	2.49s	9.34s
Tiempo de respuesta (máximo)	6.70s	35.34s
Tiempo de respuesta (total)	52.26s	177.48s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#138 Ling-2.6-flash

none

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	726	573	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Ling-2.6-flash	5.3	10.0	33.3%	0		11.21s	813	381	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	20,818	1,069	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	8,004	246	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	810	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	540	109	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	732	81	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	729	151	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	7,324	229	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	222	15	0

Comparación rápida

Cambiar par de comparación

Seed-2.0-LitenonevsNemotron 3 SupermediumDisponible gratis CobuddymediumvsSeed-2.0-Litenone Ling-2.6-flashnonevsMistral Small 4medium Ling-2.6-flashnonevsMiniMax M2.7medium Seed-2.0-LitenonevsDeepSeek V4 Prohigh Ling-2.6-flashnonevsMiniMax M2.5medium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponible gratis Ling-2.6-flashnonevsQwen3 Coder Nextmedium Seed-2.0-LitenonevsMiniMax M2.5medium Seed-2.0-LitenonevsMiniMax M2.7medium Seed-2.0-LitenonevsMistral Small 4medium Seed-2.0-LitenonevsGPT-5 Nanomedium