Seed-2.0-Lite (medium) vs GPT-5.4 (medium)

Modelo recomendado Seed-2.0-Lite (medium)

Su puntuación se mantiene cerca de la mejor aquí (7.9 vs 8.5) y cuesta aproximadamente 6.6x menos que GPT-5.4 (medium).

Comparación detallada

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	GPT-5.4 GPT-5.4 medium Lanzamiento: 2026-03-05

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	GPT-5.4 GPT-5.4 medium Lanzamiento: 2026-03-05
Puntuación	7.9	8.5
Rango	#42	#24
Fiabilidad	10.0	10.0
Consistencia	8.6	8.6
Pruebas correctas
Tasa de aciertos por intento	74.2%	77.3%
Pruebas inestables	4	4
Ejecuciones totales	66	66
Costo por resultado	1.669	10.220
Costo total	$0.234	$1.533
Precio de entrada	$0.250 / 1M	$2.500 / 1M
Precio de salida	$2.000 / 1M	$15.000 / 1M
Total de tokens de entrada	129,897	81,127
Tokens de salida	12,533	6,155
Tokens de razonamiento	88,047	82,515
Tiempo de respuesta (promedio)	48.53s	23.10s
Tiempo de respuesta (máximo)	254.92s	100.41s
Tiempo de respuesta (total)	1067.74s	508.26s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GPT-5.4	8.3	10.0	75.0%	0		4.11s	606	240	1,511

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GPT-5.4	8.8	7.8	88.9%	1		44.36s	7,305	433	24,216

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.4	5.8	66.7%	1		58.52s	99,411	9,809	13,940
GPT-5.4	10.0	10.0	100.0%	0		29.77s	58,038	4,214	13,351

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GPT-5.4	10.0	10.0	100.0%	0		5.32s	7,140	234	804

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GPT-5.4	5.3	7.2	44.4%	1		74.27s	619	61	34,748

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GPT-5.4	4.7	3.1	33.3%	1		4.92s	477	145	321

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GPT-5.4	10.0	10.0	100.0%	0		3.11s	660	93	897

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GPT-5.4	8.2	7.2	88.9%	1		9.14s	642	441	3,815

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GPT-5.4	10.0	10.0	100.0%	0		13.28s	5,445	264	1,031

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GPT-5.4	3.0	10.0	0.0%	0		13.95s	195	30	1,821

Cambiar par de comparación