AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.5 Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash minimal Lanzamiento: 2026-05-19

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash minimal Lanzamiento: 2026-05-19
Puntuación	8.3	8.1
Rango	#15	#21
Fiabilidad	10.0	10.0
Consistencia	8.9	9.6
Pruebas correctas
Tasa de aciertos por intento	79.0%	75.4%
Pruebas inestables	3	1
Ejecuciones totales	57	57
Costo por resultado	0.958	0.494
Costo total	$0.125	$0.070
Precio de entrada	$0.250 / 1M	$1.500 / 1M
Precio de salida	$2.000 / 1M	$9.000 / 1M
Tokens de salida	3,266	2,262
Tokens de razonamiento	54,082	0
Tiempo de respuesta (promedio)	31.32s	1.37s
Tiempo de respuesta (máximo)	168.71s	3.56s
Tiempo de respuesta (total)	595.04s	26.04s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	405	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.28s	441	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemini 3.5 Flash	3.0	10.0	0.0%	0		3.56s	404	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	279	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	12	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	117	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	76	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	282	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	234	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	9	2,040
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	12	0

Comparación rápida

Cambiar par de comparación

Gemini 3.5 FlashminimalvsQwen3.5-27Bmedium Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Gemini 3.5 FlashminimalvsGLM 5medium Gemini 3.5 FlashminimalvsGLM 5 Turbomedium Gemini 3.5 FlashminimalvsQwen3.6 35B A3Bmedium Gemini 3.5 FlashminimalvsGPT-5.3-Codexmedium Gemini 3.5 FlashminimalvsQwen3.5 Plus 2026-02-15medium Gemini 3.5 FlashminimalvsGrok 4.3medium Gemini 3.5 FlashminimalvsGPT-5.4medium Gemini 3.5 FlashminimalvsQwen3.6 Plusmedium Gemini 3.5 FlashminimalvsQwen3.5-122B-A10Bmedium Gemini 3.5 FlashminimalvsMiMo-V2.5medium