AI BENCHY Compare

Elephant Alpha vs Xiaomi: MiMo-V2-Pro

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-01

Métrica	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14	MiMo-V2-Pro MiMo-V2-Pro none Lanzamiento: 2026-03-18

Métrica	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14	MiMo-V2-Pro MiMo-V2-Pro none Lanzamiento: 2026-03-18
Puntuación	5.2	6.0
Rango	#112	#87
Fiabilidad	N/D	N/D
Consistencia	9.6	8.6
Pruebas correctas
Tasa de aciertos por intento	29.6%	48.2%
Pruebas inestables	1	3
Ejecuciones totales	54	54
Costo por resultado	0.000	0.601
Costo total	$0.000	$0.043
Precio de entrada	$0.000 / 1M	$1.000 / 1M
Precio de salida	$0.000 / 1M	$3.000 / 1M
Tokens de salida	2,596	2,320
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	1.27s	2.39s
Tiempo de respuesta (máximo)	3.70s	6.58s
Tiempo de respuesta (total)	22.82s	43.06s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0
MiMo-V2-Pro	3.5	8.0	16.7%	1		1.80s	315	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	5.1	3.3	33.3%	1		1.30s	365	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.82s	599	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0
MiMo-V2-Pro	3.0	10.0	0.0%	0		6.58s	333	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		1.39s	249	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0
MiMo-V2-Pro	5.3	7.2	44.4%	1		1.78s	26	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0
MiMo-V2-Pro	4.3	9.9	0.0%	0		2.44s	125	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0
MiMo-V2-Pro	6.5	10.0	50.0%	0		2.51s	69	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.7	10.0	0.0%	0		867ms	166	0
MiMo-V2-Pro	6.0	7.1	55.6%	1		1.83s	327	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.39s	277	0

Comparación rápida

Cambiar par de comparación

Trinity Large PreviewnonevsElephant Alphamedium Nemotron 3 SupernoneDisponible gratisvsElephant Alphamedium Mistral Small 4nonevsElephant Alphamedium DeepSeek V4 FlashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3 Coder Nextnone GPT-5.4 MininonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium gpt-oss-120bnoneDisponible gratisvsElephant Alphamedium Elephant AlphamediumvsMiMo-V2.5none Elephant AlphamediumvsQwen3.6 35B A3Bnone Laguna Xs.2mediumDisponible gratisvsMiMo-V2-Pronone gpt-oss-120bmediumDisponible gratisvsMiMo-V2-Pronone