AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs NVIDIA: Nemotron 3 Super

Resumen

Comparación benchmark de Seed-2.0-Lite vs Nemotron 3 Super: La puntuación media está prácticamente empatada en 5.8 vs 5.8. Seed-2.0-Lite tiene menor coste de benchmark con $0.019 vs $0.021. Seed-2.0-Lite es más rápido con 2.49s vs 32.00s, con tasas de acierto de 46.0% vs 41.3%.

Modelo recomendado: Seed-2.0-Lite - Tiene la mejor puntuación aquí (5.8) y responde aproximadamente 12.9x más rápido que Nemotron 3 Super.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-10

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Nemotron 3 Super Nemotron 3 Super medium Lanzamiento: 2026-03-11 Disponible gratis

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lanzamiento: 2026-02-14	Nemotron 3 Super Nemotron 3 Super medium Lanzamiento: 2026-03-11 Disponible gratis
Puntuación	5.8	5.8
Rango	#111	#106
Fiabilidad	10.0	10.0
Consistencia	8.4	9.2
Pruebas correctas
Tasa de aciertos por intento	46.0%	41.3%
Pruebas inestables	4	2
Ejecuciones totales	63	63
Costo por resultado	0.228	0.004
Costo total	$0.019	$0.021
Precio de entrada	$0.250 / 1M	$0.090 / 1M
Precio de salida	$2.000 / 1M	$0.450 / 1M
Total de tokens de entrada	46,573	37,527
Tokens de salida	3,259	14,850
Tokens de razonamiento	0	33,754
Tiempo de respuesta (promedio)	2.49s	32.00s
Tiempo de respuesta (máximo)	6.70s	232.25s
Tiempo de respuesta (total)	52.26s	607.91s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#106 Nemotron 3 Super

medium

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Nemotron 3 Super	8.3	10.0	75.0%	0		7.85s	686	748	1,305

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Nemotron 3 Super	3.1	10.0	0.0%	0		147.32s	2,275	797	4,424

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Nemotron 3 Super	10.0	10.0	100.0%	0		87.80s	15,561	2,021	9,996

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Nemotron 3 Super	10.0	10.0	100.0%	0		18.16s	7,944	877	2,607

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Nemotron 3 Super	2.9	4.4	22.2%	2		16.19s	456	5,255	6,072

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Nemotron 3 Super	4.1	10.0	0.0%	0		6.91s	492	105	363

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Nemotron 3 Super	7.3	10.0	50.0%	0		6.97s	723	956	2,383

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Nemotron 3 Super	3.0	10.0	0.0%	0		3.15s	708	570	1,322

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Nemotron 3 Super	10.0	10.0	100.0%	0		39.75s	8,544	270	1,969

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Nemotron 3 Super	3.0	10.0	0.0%	0		55.32s	138	3,251	3,313

Comparación rápida

Cambiar par de comparación