AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Flash Lite Preview

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-15

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lanzamiento: 2026-03-03

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lanzamiento: 2026-03-03
Rango	#3	#16
Puntuación	8.8	8.0
Consistencia	8.7	10.0
Costo por resultado	0.870	0.443
Costo total	$0.105	$0.049
Pruebas correctas
Tasa de aciertos por intento	87.5%	68.8%
Pruebas inestables	3	0
Ejecuciones totales	48	48
Tokens de salida	2,815	1,731
Tokens de razonamiento	44,618	25,821
Tiempo de respuesta (promedio)	29.39s	3.83s
Tiempo de respuesta (máximo)	168.71s	14.93s
Tiempo de respuesta (total)	470.29s	61.25s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		23.34s	990	7,037
Gemini 3.1 Flash Lite Preview	8.8	10.0	66.7%	0		2.53s	564	3,780

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewmediumvsGLM 5none Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone Claude Sonnet 4.6nonevsSeed-2.0-Litemedium