AI BENCHY Compare

Hunter Alpha vs Z.ai: GLM 5.1

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-07

Métrica	Hunter Alpha Hunter Alpha none Lanzamiento: 2026-03-11	GLM 5.1 GLM 5.1 none Lanzamiento: 2026-04-07

Métrica	Hunter Alpha Hunter Alpha none Lanzamiento: 2026-03-11	GLM 5.1 GLM 5.1 none Lanzamiento: 2026-04-07
Puntuación	5.9	5.6
Rango	#64	#67
Consistencia	8.1	8.2
Pruebas correctas
Tasa de aciertos por intento	49.0%	39.2%
Pruebas inestables	4	4
Ejecuciones totales	51	51
Costo por resultado	0.000	1.000
Costo total	$0.000	$0.050
Precio de entrada	$0.000 / 1M	$1.000 / 1M
Precio de salida	$0.000 / 1M	$3.200 / 1M
Tokens de salida	2,278	3,219
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	4.58s	4.01s
Tiempo de respuesta (máximo)	15.17s	32.57s
Tiempo de respuesta (total)	77.92s	68.23s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	3.5	8.0	16.7%	1		3.81s	779	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	305	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	3.0	10.0	0.0%	0		15.17s	379	0
GLM 5.1	2.8	2.1	33.3%	1		32.57s	2,129	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	10.0	10.0	100.0%	0		8.49s	249	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	204	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	5.3	10.0	33.3%	0		2.33s	27	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	6.1	3.1	66.7%	1		2.71s	91	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	39	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	6.4	10.0	50.0%	0		2.82s	69	0
GLM 5.1	8.3	10.0	50.0%	0		1.58s	66	0

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	5.8	4.4	66.7%	2		3.06s	349	0
GLM 5.1	5.7	10.0	33.3%	0		1.48s	152	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	300	0

Comparación rápida

Cambiar par de comparación

MiniMax M2.5mediumDisponible gratisvsHunter Alphanone Mistral Small 4mediumvsGLM 5.1none gpt-oss-120bmediumDisponible gratisvsHunter Alphanone MiniMax M2.5mediumDisponible gratisvsGLM 5.1none Mistral Small 4mediumvsHunter Alphanone gpt-oss-120bmediumDisponible gratisvsGLM 5.1none Hunter AlphanonevsGrok 4.20 Multi Agent Betamedium GPT-5 NanomediumvsHunter Alphanone Mercury 2mediumvsHunter Alphanone Grok 4.20 Multi Agent BetamediumvsGLM 5.1none GPT-5 NanomediumvsGLM 5.1none MiniMax M2.7mediumvsGLM 5.1none