Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: GPT-4o-mini

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-12

Métrica Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none Lanzamiento: 2026-03-11 Disponible gratis GPT-4o-mini GPT-4o-mini none Lanzamiento: 2024-07-18
Rango #59 #55
Puntaje prom. 3.4 4.0
Consistencia 8.6 10.0
Costo por resultado 0.000 0.114
Costo total $0.000 $0.005
Pruebas correctas
Tasa de aciertos por intento 31.3% 25.0%
Pruebas inestables 3 0
Ejecuciones totales 48 48
Tokens de salida 4,222 1,594
Tokens de razonamiento 0 0
Tiempo de respuesta (promedio) 8.90s 2.07s
Tiempo de respuesta (máximo) 24.97s 7.58s
Tiempo de respuesta (total) 142.40s 18.60s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntaje prom. vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
GPT-4o-mini 4.0 10.0 33.3% 0 1.83s 180 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
GPT-4o-mini 10.0 10.0 0.0% 0 7.58s 568 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
GPT-4o-mini 9.9 10.0 100.0% 0 1.27s 183 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
GPT-4o-mini 10.0 10.0 0.0% 0 637ms 15 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
GPT-4o-mini 3.0 10.0 0.0% 0 909ms 66 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
GPT-4o-mini 4.5 10.0 0.0% 0 1.27s 69 0
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
GPT-4o-mini 2.3 10.0 0.0% 0 1.30s 308 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0

Comparación rápida

Cambiar par de comparación