AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-26

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	gpt-oss-120b gpt-oss-120b none Lanzamiento: 2025-08-05 Disponible gratis

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	gpt-oss-120b gpt-oss-120b none Lanzamiento: 2025-08-05 Disponible gratis
Puntuación	5.9	5.4
Rango	#100	#119
Fiabilidad	10.0	10.0
Consistencia	8.3	9.1
Pruebas correctas
Tasa de aciertos por intento	48.3%	38.6%
Pruebas inestables	4	2
Ejecuciones totales	98	133
Costo por resultado	0.405	0.302
Costo total	$0.033	$0.019
Precio de entrada	$0.250 / 1M	$0.000 / 1M
Precio de salida	$2.000 / 1M	$0.000 / 1M
Tokens de salida	10,283	91,564
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	2.48s	21.61s
Tiempo de respuesta (máximo)	6.70s	113.71s
Tiempo de respuesta (total)	49.67s	345.79s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	10,870	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	7,739	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	34,952	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0

Comparación rápida

Cambiar par de comparación

MiniMax M2.5mediumDisponible gratisvsgpt-oss-120bnoneDisponible gratis Mistral Small 4mediumvsgpt-oss-120bnoneDisponible gratis Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponible gratis Seed-2.0-LitenonevsNemotron 3 SupermediumDisponible gratis gpt-oss-120bnoneDisponible gratisvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneDisponible gratis CobuddymediumDisponible gratisvsSeed-2.0-Litenone Seed-2.0-LitenonevsGPT-5 Nanomedium CobuddymediumDisponible gratisvsgpt-oss-120bnoneDisponible gratis gpt-oss-120bnoneDisponible gratisvsOwl Alphamedium Seed-2.0-LitenonevsMiniMax M2.5mediumDisponible gratis