AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Gemini 3 PRO Preview

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-30

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Lanzamiento: 2025-11-18

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Lanzamiento: 2025-11-18
Puntuación	8.6	8.4
Rango	#12	#17
Fiabilidad	N/D	N/D
Consistencia	8.8	10.0
Pruebas correctas
Tasa de aciertos por intento	83.3%	77.8%
Pruebas inestables	3	0
Ejecuciones totales	54	54
Costo por resultado	0.926	1.406
Costo total	$0.121	$0.197
Precio de entrada	$0.250 / 1M	$0.000 / 1M
Precio de salida	$2.000 / 1M	$0.000 / 1M
Tokens de salida	3,257	1,508
Tokens de razonamiento	52,042	10,084
Tiempo de respuesta (promedio)	30.37s	9.06s
Tiempo de respuesta (máximo)	168.71s	26.24s
Tiempo de respuesta (total)	546.72s	90.58s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		14.99s	149	1,485

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		0ms	0	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		10.37s	351	952

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		10.84s	279	3,156

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemini 3 PRO Preview	5.3	10.0	33.3%	0		7.01s	15	1,195

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		9.34s	78	374

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemini 3 PRO Preview	9.8	10.0	100.0%	0		3.26s	69	754

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		3.91s	243	1,197

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		11.96s	324	971

Comparación rápida

Cambiar par de comparación

Seed-2.0-LitemediumvsHY3 PreviewhighDisponible gratis Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Gemini 3 PRO PreviewmediumvsHY3 PreviewhighDisponible gratis Gemini 3 PRO PreviewmediumvsHY3 PreviewlowDisponible gratis Seed-2.0-LitemediumvsGPT-5.5low Seed-2.0-LitemediumvsHY3 PreviewlowDisponible gratis Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Gemini 3 PRO PreviewmediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Gemini 3 PRO PreviewmediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGemini 3 PRO Previewmedium Claude Opus 4.7nonevsSeed-2.0-Litemedium