AI BENCHY Compare

MiniMax: MiniMax M2.7 vs MoonshotAI: Kimi K2.5

Resumen

Comparación benchmark de MiniMax M2.7 vs Kimi K2.5: Kimi K2.5 lidera en puntuación media con 5.5 vs 5.2. Kimi K2.5 tiene menor coste de benchmark con $0.027 vs $0.104. Kimi K2.5 es más rápido con 13.18s vs 38.18s, con tasas de acierto de 46.0% vs 34.9%.

Modelo recomendado: Kimi K2.5 - Tiene la mejor puntuación aquí (5.5) y cuesta aproximadamente 3.9x menos que MiniMax M2.7.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	MiniMax M2.7 MiniMax M2.7 medium Lanzamiento: 2026-03-18	Kimi K2.5 Kimi K2.5 none Lanzamiento: 2026-01-27

Métrica	MiniMax M2.7 MiniMax M2.7 medium Lanzamiento: 2026-03-18	Kimi K2.5 Kimi K2.5 none Lanzamiento: 2026-01-27
Puntuación	5.2	5.5
Rango	#127	#118
Fiabilidad	10.0	10.0
Consistencia	6.8	8.9
Pruebas correctas
Tasa de aciertos por intento	46.0%	34.9%
Pruebas inestables	8	3
Ejecuciones totales	63	63
Costo por resultado	2.494	0.442
Costo total	$0.104	$0.027
Precio de entrada	$0.250 / 1M	$0.375 / 1M
Precio de salida	$1.000 / 1M	$2.025 / 1M
Total de tokens de entrada	34,371	36,034
Tokens de salida	8,981	6,657
Tokens de razonamiento	89,812	0
Tiempo de respuesta (promedio)	38.18s	13.18s
Tiempo de respuesta (máximo)	196.21s	42.13s
Tiempo de respuesta (total)	763.60s	184.47s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 MiniMax M2.7

medium

Coste: $0.022
Tiempo: 22.8s
Tokens: 9,250 tok

#118 MoonshotAI: Kimi K2.5

none

Coste: $0.015
Tiempo: 89.1s
Tokens: 5,421 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	12,264	748	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Comparación rápida

Cambiar par de comparación

MiniMax M2.7mediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsQwen3 Coder Nextnone North Mini CodenoneDisponible gratisvsMiniMax M2.7medium MiniMax M2.7mediumvsMiMo-V2.5none DeepSeek V3.2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsGLM 5 Turbonone Trinity Large PreviewnonevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-4o-mininone