AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Elephant Alpha

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-04

Métrica	Kimi K2.6 Kimi K2.6 none Lanzamiento: 2026-04-20 Disponible gratis	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14

Métrica	Kimi K2.6 Kimi K2.6 none Lanzamiento: 2026-04-20 Disponible gratis	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14
Puntuación	5.5	5.1
Rango	#124	#136
Fiabilidad	10.0	N/D
Consistencia	9.2	9.7
Pruebas correctas
Tasa de aciertos por intento	36.5%	30.2%
Pruebas inestables	2	1
Ejecuciones totales	63	63
Costo por resultado	1.267	0.000
Costo total	$0.079	$0.000
Precio de entrada	$0.684 / 1M	$0.000 / 1M
Precio de salida	$3.420 / 1M	$0.000 / 1M
Total de tokens de entrada	32,916	33,744
Tokens de salida	16,410	2,596
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	13.27s	1.27s
Tiempo de respuesta (máximo)	238.89s	3.70s
Tiempo de respuesta (total)	278.57s	22.82s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	726	815	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
Elephant Alpha	3.7	7.8	11.1%	1		1.30s	813	365	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	14,046	562	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
Elephant Alpha	6.5	10.0	50.0%	0		979ms	8,004	246	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
Elephant Alpha	3.0	10.0	0.0%	0		925ms	810	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
Elephant Alpha	4.3	10.0	0.0%	0		920ms	540	105	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
Elephant Alpha	9.8	10.0	100.0%	0		987ms	732	82	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
Elephant Alpha	5.3	10.0	33.3%	0		868ms	729	166	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	7,344	231	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
Elephant Alpha	3.0	10.0	0.0%	0		0ms	0	0	0

Comparación rápida

Cambiar par de comparación

Kimi K2.5nonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone DeepSeek V3.2nonevsElephant Alphamedium MiniMax M2.5mediumvsKimi K2.6noneDisponible gratis DeepSeek V4 FlashnonevsElephant Alphamedium CobuddymediumvsKimi K2.6noneDisponible gratis MiniMax M2.7mediumvsKimi K2.6noneDisponible gratis Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsKimi K2.6noneDisponible gratis Elephant AlphamediumvsQwen3 Coder Nextnone Nemotron 3 SupernoneDisponible gratisvsElephant Alphamedium