AI BENCHY Compare

MiniMax: MiniMax M2.5 vs Z.ai: GLM 4.7 Flash

Resumen

GLM 4.7 Flash lidera en puntuación media con 4.9 vs 4.7. GLM 4.7 Flash tiene menor coste de benchmark con $0.004 vs $0.303. GLM 4.7 Flash es más rápido con 2.86s vs 65.37s, con tasas de acierto de 46.0% vs 36.5%.

Modelo recomendadoGLM 4.7 FlashTiene la mejor puntuación aquí (4.9) y cuesta aproximadamente 90.2x menos que MiniMax M2.5 (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-16

Métrica	MiniMax M2.5 MiniMax M2.5 medium Lanzamiento: 2026-02-12	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19

Métrica	MiniMax M2.5 MiniMax M2.5 medium Lanzamiento: 2026-02-12	GLM 4.7 Flash GLM 4.7 Flash none Lanzamiento: 2026-01-19
Puntuación	4.7	4.9
Rango	#175	#170
Fiabilidad	10.0	10.0
Consistencia	6.5	8.8
Pruebas correctas
Tasa de aciertos por intento	46.0%	36.5%
Pruebas inestables	9	3
Ejecuciones totales	63	63
Costo por resultado	7.900	0.056
Costo total	$0.303	$0.004
Precio de entrada	$0.150 / 1M	$0.061 / 1M
Precio de salida	$0.900 / 1M	$0.400 / 1M
Total de tokens de entrada	43,706	38,745
Tokens de salida	109,495	2,521
Tokens de razonamiento	330,814	0
Tiempo de respuesta (promedio)	65.37s	2.86s
Tiempo de respuesta (máximo)	251.36s	7.05s
Tiempo de respuesta (total)	849.76s	40.04s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#175 MiniMax M2.5

medium

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

#170 GLM 4.7 Flash

none

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	7.9	6.3	83.3%	2		20.82s	612	286	45,344
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	555	438	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	3.4	9.1	0.0%	0		188.58s	6,076	357	106,177
GLM 4.7 Flash	4.3	10.0	0.0%	0		2.54s	7,256	650	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	4.5	2.1	66.7%	1		60.39s	21,104	740	9,713
GLM 4.7 Flash	3.0	10.0	0.0%	0		3.22s	14,325	704	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	4.6	1.7	66.7%	2		7.48s	6,584	266	3,835
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	7,107	196	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	2.9	4.4	22.2%	2		237.27s	308	105,047	133,487
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	687	19	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	3.8	2.5	33.3%	1		6.63s	492	25	1,686
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	477	134	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	7.5	10.0	50.0%	0		621ms	699	156	1,495
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	636	62	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	5.3	7.2	44.4%	1		11.21s	495	1,069	9,605
GLM 4.7 Flash	6.4	10.0	33.3%	0		1.20s	609	97	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	7,123	269	937
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	6,907	212	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.5	3.0	10.0	0.0%	0		80.79s	213	1,280	18,535
GLM 4.7 Flash	3.0	10.0	0.0%	0		692ms	186	9	0

Comparación rápida

Cambiar par de comparación

Ling-2.6-1TnonevsMiniMax M2.5medium CobuddymediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGPT-5.4 Nanonone Mercury 2nonevsMiniMax M2.5medium Ring-2.6-1TnonevsMiniMax M2.5medium Ling-2.6-flashnonevsMiniMax M2.5medium MiniMax M2.5mediumvsNemotron 3 SupernoneDisponible gratis KAT-Coder-Air V2.5nonevsMiniMax M2.5medium Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGPT-4o-mininone Trinity Large PreviewnonevsMiniMax M2.5medium