AI BENCHY Compare

Xiaomi: MiMo-V2.5-Pro vs Z.ai: GLM 5.1

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07

Métrica	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22	GLM 5.1 GLM 5.1 medium Lanzamiento: 2026-04-07
Puntuación	7.6	7.4
Rango	#40	#51
Fiabilidad	10.0	3.3
Consistencia	8.9	8.3
Pruebas correctas
Tasa de aciertos por intento	68.3%	71.7%
Pruebas inestables	3	4
Ejecuciones totales	60	60
Costo por resultado	2.407	2.379
Costo total	$0.289	$0.286
Precio de entrada	$1.000 / 1M	$0.980 / 1M
Precio de salida	$3.000 / 1M	$3.080 / 1M
Tokens de salida	4,957	11,475
Tokens de razonamiento	80,301	71,876
Tiempo de respuesta (promedio)	21.77s	32.22s
Tiempo de respuesta (máximo)	130.77s	172.60s
Tiempo de respuesta (total)	435.33s	612.25s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	323	1,179
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	7.0	6.2	66.7%	1		81.67s	769	33,771
GLM 5.1	4.7	1.6	66.7%	2		145.56s	4,727	34,384

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	155	163
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	1,941	2,014
GLM 5.1	3.0	10.0	0.0%	0		29.40s	82	2,179

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash LitelowvsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium GPT-5.2 ChatnonevsMiMo-V2.5-Promedium Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium DeepSeek V4 FlashhighDisponible gratisvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5-Promedium Ring-2.6-1TnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium Gemini 3.1 Flash LitelowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium