AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs OpenAI: gpt-oss-120b

Resumen

Comparación benchmark de Nemotron 3 Ultra 550b A55b vs gpt-oss-120b: Nemotron 3 Ultra 550b A55b lidera en puntuación media con 6.1 vs 4.0. gpt-oss-120b tiene menor coste de benchmark con $0.010 vs $0.027. Nemotron 3 Ultra 550b A55b es más rápido con 2.27s vs 21.61s, con tasas de acierto de 44.4% vs 34.9%.

Modelo recomendado: Nemotron 3 Ultra 550b A55b - Tiene la mejor puntuación aquí (6.1) y responde aproximadamente 9.5x más rápido que gpt-oss-120b.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Lanzamiento: 2026-06-04 Disponible gratis	gpt-oss-120b gpt-oss-120b none Lanzamiento: 2025-08-05 Disponible gratis

Métrica	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Lanzamiento: 2026-06-04 Disponible gratis	gpt-oss-120b gpt-oss-120b none Lanzamiento: 2025-08-05 Disponible gratis
Puntuación	6.1	4.0
Rango	#99	#164
Fiabilidad	10.0	10.0
Consistencia	9.2	8.2
Pruebas correctas
Tasa de aciertos por intento	44.4%	34.9%
Pruebas inestables	2	2
Ejecuciones totales	63	57
Costo por resultado	0.000	0.168
Costo total	$0.027	$0.010
Precio de entrada	$0.500 / 1M	$0.039 / 1M
Precio de salida	$2.200 / 1M	$0.180 / 1M
Total de tokens de entrada	43,326	9,081
Tokens de salida	2,138	51,664
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	2.27s	21.61s
Tiempo de respuesta (máximo)	13.49s	113.71s
Tiempo de respuesta (total)	47.65s	345.79s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#99 Nemotron 3 Ultra 550b A55b

none

Coste: $0.000
Tiempo: 149.6s
Tokens: 3,405 tok

#164 gpt-oss-120b

none

Aún no se ha generado ningún resultado showcase para este modelo.

Coste: $0.000
Tiempo: -
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	3.5	8.0	16.7%	1		2.35s	696	239	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	1,336	8,676	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	5.5	10.0	33.3%	0		1.02s	7,623	369	0
gpt-oss-120b	1.5	4.0	22.2%	1		9.57s	901	3,232	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		4.79s	15,558	357	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		1.94s	7,944	249	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	2,421	598	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	5.3	10.0	33.3%	0		698ms	789	27	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	1,294	29,483	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	5.0	10.0	0.0%	0		13.49s	516	101	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	584	615	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		1.46s	723	69	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,043	1,940	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	5.9	7.2	55.6%	1		1.06s	726	352	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	1,188	3,982	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		2.99s	8,544	264	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		1.83s	207	111	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	314	3,138	0

Comparación rápida

Cambiar par de comparación