Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica Mercury 2 Mercury 2 medium Lanzamiento: 2026-02-24 GPT-5 Nano GPT-5 Nano medium Lanzamiento: 2025-08-07
Puntuación 6.3 6.1
Rango #90 #94
Fiabilidad 10.0 10.0
Consistencia 8.4 7.1
Pruebas correctas
Tasa de aciertos por intento 50.0% 55.0%
Pruebas inestables 4 7
Ejecuciones totales 60 60
Costo por resultado 0.687 0.945
Costo total $0.055 $0.076
Precio de entrada $0.250 / 1M $0.050 / 1M
Precio de salida $0.750 / 1M $0.400 / 1M
Tokens de salida 4,015 5,338
Tokens de razonamiento 58,382 179,584
Tiempo de respuesta (promedio) 2.27s 43.11s
Tiempo de respuesta (máximo) 14.63s 204.02s
Tiempo de respuesta (total) 43.15s 560.45s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 7.2 6.5 66.7% 1 2.29s 270 8,514
GPT-5 Nano 5.4 6.6 33.3% 1 47.80s 604 30,144
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
GPT-5 Nano 9.8 10.0 100.0% 0 11.90s 382 4,096
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 3.8 7.3 22.2% 1 934ms 354 2,758
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 234 6,144

Comparación rápida

Cambiar par de comparación