ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Flash Lite

Seed-2.0-Lite lidera en puntuación media con 6.2 vs 6.1. Gemini 3.1 Flash Lite (minimal) tiene menor coste de benchmark con $0.047 vs $0.066. Gemini 3.1 Flash Lite (minimal) es más rápido con 1.86s vs 4.40s, con tasas de acierto de 43.9% vs 51.5%.

Modelo recomendadoGemini 3.1 Flash Lite (minimal)Su puntuación se mantiene cerca de la mejor aquí (6.1 vs 6.2) y responde aproximadamente 2.4x más rápido que Seed-2.0-Lite.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-25

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lanzamiento: 2026-05-08

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lanzamiento: 2026-05-08
Puntuación	6.2	6.1
Rango	#127	#131
Fiabilidad	10.0	10.0
Consistencia	8.5	8.9
Pruebas correctas
Tasa de aciertos por intento	43.9%	51.5%
Pruebas inestables	4	3
Ejecuciones totales	66	66
Costo por resultado	0.814	0.465
Costo total	$0.066	$0.047
Precio de entrada	$0.250 / 1M	$0.250 / 1M
Precio de salida	$2.000 / 1M	$1.500 / 1M
Total de tokens de entrada	142,197	119,065
Tokens de salida	14,746	11,118
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	4.40s	1.86s
Tiempo de respuesta (máximo)	44.58s	12.97s
Tiempo de respuesta (total)	96.84s	40.88s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 Seed-2.0-Lite

none

Coste: $0.005
Tiempo: 83.8s
Tokens: 2,311 tok

#131 Gemini 3.1 Flash Lite

minimal

Coste: $0.001
Tiempo: 3.7s
Tokens: 635 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	500	639	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		831ms	8,126	666	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		25.58s	111,839	11,985	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		7.75s	94,962	8,988	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	7,552	279	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	641	15	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	490	63	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	615	72	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	564	153	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	5,457	234	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	158	9	0

Comparación rápida

Cambiar par de comparación