Navegación
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: gpt-oss-120b

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-05

Métrica Inception: Mercury 2 none Lanzamiento: 2026-02-24 OpenAI: gpt-oss-120b medium Lanzamiento: 2025-08-05 Disponible gratis
Rango #50 #36
Puntaje prom. 34 52
Consistencia 89 72
Costo por resultado 0.147 0.133
Costo total $0.006 $0.010
Tiempo de respuesta (promedio) 594ms 17.75s
Tiempo de respuesta (máximo) 1.27s 50.92s
Tiempo de respuesta (total) 8.91s 141.98s
Pruebas correctas
Tasa de aciertos por intento 33.3% 57.8%
Pruebas inestables 2 5
Tokens de salida 1,144 13,103
Tokens de razonamiento 0 33,843

Mejores modelos por puntuación

Tiempo de respuesta (promedio)

Puntuación vs costo total

Puntaje prom. vs Tiempo de respuesta (promedio)

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 100 100 0.0% 0 466ms 274 0
OpenAI: gpt-oss-120b 70 98 66.7% 0 19.76s 3,463 2,077
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 100 100 0.0% 0 606ms 131 0
OpenAI: gpt-oss-120b 100 100 100.0% 0 31.18s 694 5,072
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 55 59 83.3% 1 667ms 180 0
OpenAI: gpt-oss-120b 55 59 66.7% 1 1.98s 241 1,114
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 40 72 44.4% 1 534ms 46 0
OpenAI: gpt-oss-120b 100 44 22.2% 2 50.92s 6,784 20,606
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 55 100 50.0% 0 551ms 82 0
OpenAI: gpt-oss-120b 95 100 100.0% 0 7.63s 126 1,799
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 100 100 0.0% 0 533ms 234 0
OpenAI: gpt-oss-120b 17 47 22.2% 2 11.80s 1,508 2,092
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Inception: Mercury 2 100 100 100.0% 0 1.27s 197 0
OpenAI: gpt-oss-120b 90 100 100.0% 0 6.91s 287 1,083

Comparación rápida

Cambiar par de comparación