AI BENCHY Compare

Inception: Mercury 2 vs Nemotron 3 Super 120b A12b

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-12

Métrica	Mercury 2 Mercury 2 none Lanzamiento: 2026-02-24	Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none Lanzamiento: 2026-03-11 Disponible gratis

Métrica	Mercury 2 Mercury 2 none Lanzamiento: 2026-02-24	Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none Lanzamiento: 2026-03-11 Disponible gratis
Rango	#61	#59
Puntaje prom.	3.4	3.4
Consistencia	9.0	8.6
Costo por resultado	0.153	0.000
Costo total	$0.007	$0.000
Pruebas correctas
Tasa de aciertos por intento	31.3%	31.3%
Pruebas inestables	2	3
Ejecuciones totales	48	48
Tokens de salida	1,303	4,222
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	596ms	8.90s
Tiempo de respuesta (máximo)	1.27s	24.97s
Tiempo de respuesta (total)	9.54s	142.40s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntaje prom. vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
Nemotron 3 Super 120b A12b	10.0	10.0	0.0%	0		7.14s	2,171	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
Nemotron 3 Super 120b A12b	10.0	10.0	0.0%	0		19.98s	124	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
Nemotron 3 Super 120b A12b	9.9	10.0	100.0%	0		7.92s	249	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
Nemotron 3 Super 120b A12b	10.0	7.2	22.2%	1		6.23s	26	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	4.0	10.0	0.0%	0		628ms	159	0
Nemotron 3 Super 120b A12b	3.0	9.9	0.0%	0		24.97s	170	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
Nemotron 3 Super 120b A12b	4.5	6.9	33.3%	1		1.50s	66	0

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
Nemotron 3 Super 120b A12b	4.7	10.0	33.3%	0		7.50s	1,135	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
Nemotron 3 Super 120b A12b	10.0	1.6	66.7%	1		16.00s	281	0

Comparación rápida

Cambiar par de comparación

Nemotron 3 Super 120b A12bnoneDisponible gratisvsQwen3 Coder Nextmedium Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium Nemotron 3 Super 120b A12bnoneDisponible gratisvsGLM 4.7 Flashmedium Mercury 2nonevsQwen3.5-9Bmedium Nemotron 3 Super 120b A12bnoneDisponible gratisvsQwen3.5-9Bmedium MiniMax M2.5mediumvsNemotron 3 Super 120b A12bnoneDisponible gratis Mercury 2nonevsMiniMax M2.5medium Nemotron 3 Super 120b A12bnoneDisponible gratisvsGrok 4.20 Multi-Agent Betamedium Mercury 2nonevsGrok 4.20 Multi-Agent Betamedium Nemotron 3 Super 120b A12bnoneDisponible gratisvsgpt-oss-120bmediumDisponible gratis Mercury 2nonevsgpt-oss-120bmediumDisponible gratis