AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Nemotron 3 Super 120b A12b

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-12

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium Lanzamiento: 2026-03-11 Disponible gratis

Métrica	DeepSeek V3.2 DeepSeek V3.2 none Lanzamiento: 2025-12-01	Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium Lanzamiento: 2026-03-11 Disponible gratis
Rango	#37	#36
Puntaje prom.	5.5	5.8
Consistencia	8.4	8.5
Costo por resultado	0.220	0.000
Costo total	$0.016	$0.000
Pruebas correctas
Tasa de aciertos por intento	54.2%	56.3%
Pruebas inestables	3	3
Ejecuciones totales	48	48
Tokens de salida	7,823	11,925
Tokens de razonamiento	0	29,687
Tiempo de respuesta (promedio)	12.86s	20.24s
Tiempo de respuesta (máximo)	115.89s	87.80s
Tiempo de respuesta (total)	205.78s	303.60s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntaje prom. vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	9.7	0.0%	0		8.79s	1,411	0
Nemotron 3 Super 120b A12b	10.0	10.0	100.0%	0		12.96s	1,754	3,264

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	8.0	10.0	0.0%	0		115.89s	2,887	0
Nemotron 3 Super 120b A12b	10.0	10.0	100.0%	0		87.80s	2,021	9,996

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	5.4	5.8	66.7%	1		9.42s	1,710	0
Nemotron 3 Super 120b A12b	9.9	10.0	100.0%	0		18.16s	877	2,607

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	7.2	22.2%	1		1.61s	24	0
Nemotron 3 Super 120b A12b	10.0	4.4	22.2%	2		16.19s	5,255	6,072

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Nemotron 3 Super 120b A12b	2.0	9.9	0.0%	0		27.86s	104	1,149

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Nemotron 3 Super 120b A12b	7.0	6.5	66.7%	1		7.72s	1,042	2,479

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	7.7	7.5	88.9%	1		7.37s	1,136	0
Nemotron 3 Super 120b A12b	1.3	9.8	0.0%	0		8.39s	602	2,151

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Nemotron 3 Super 120b A12b	10.0	10.0	100.0%	0		39.75s	270	1,969

Comparación rápida

Cambiar par de comparación

DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Nemotron 3 Super 120b A12bmediumDisponible gratisvsGLM 5none DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsHunter Alphamedium Nemotron 3 Super 120b A12bmediumDisponible gratisvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsgpt-oss-120bmediumDisponible gratis DeepSeek V3.2nonevsGPT-5 Minimedium Nemotron 3 Super 120b A12bmediumDisponible gratisvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsNemotron 3 Super 120b A12bmediumDisponible gratis DeepSeek V3.2nonevsGrok 4.20 Multi-Agent Betamedium DeepSeek V3.2nonevsGrok 4.1 Fastmedium