Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Hunter Alpha

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-17

Métrica GPT-5.4 Mini GPT-5.4 Mini medium Lanzamiento: 2026-03-17 Hunter Alpha Hunter Alpha none Lanzamiento: Fecha de lanzamiento desconocida
Rango #34 #51
Puntuación 7.1 5.9
Consistencia 7.2 8.1
Costo por resultado 3.610 0.000
Costo total $0.289 $0.000
Pruebas correctas
Tasa de aciertos por intento 68.6% 49.0%
Pruebas inestables 6 4
Ejecuciones totales 51 51
Tokens de salida 1,708 2,278
Tokens de razonamiento 58,019 0
Tiempo de respuesta (promedio) 15.66s 4.58s
Tiempo de respuesta (máximo) 102.91s 15.17s
Tiempo de respuesta (total) 266.14s 77.92s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Hunter Alpha 3.5 8.0 16.7% 1 3.81s 779 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Hunter Alpha 3.0 10.0 0.0% 0 15.17s 379 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Hunter Alpha 10.0 10.0 100.0% 0 8.49s 249 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Hunter Alpha 5.3 10.0 33.3% 0 2.33s 27 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Hunter Alpha 6.1 3.1 66.7% 1 2.71s 91 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Hunter Alpha 6.4 10.0 50.0% 0 2.82s 69 0
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Hunter Alpha 5.8 4.4 66.7% 2 3.06s 349 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

Comparación rápida

Cambiar par de comparación