Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Flash

Nombre del modelo:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en : 2026-02-27 15:16

Resumen

Métrica	StepFun: Step 3.5 Flash medium Lanzamiento: Fecha de lanzamiento desconocida Disponible gratis	Xiaomi: MiMo-V2-Flash none Lanzamiento: Fecha de lanzamiento desconocida
Rango	#11	#37
Puntuación	7.00	3.07
Consistencia	8.32	7.66
Costo por resultado	0.000	0.690
Costo total	$0.000	$0.021
Pruebas correctas
Pruebas incorrectas	5	11
Tasa de aciertos por intento	73.8%	31.0%
Pruebas inestables	3	4
Tokens de salida	60,502	67,133
Tokens de razonamiento	117,044	0

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		13,924	17,208
Xiaomi: MiMo-V2-Flash	1.00	7.33	11.1%	1		859	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		535	11,548
Xiaomi: MiMo-V2-Flash	1.00	5.81	16.7%	1		161	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	4.00	7.21	44.4%	1		40,942	74,237
Xiaomi: MiMo-V2-Flash	4.00	7.21	44.4%	1		24	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		2,121	3,274
Xiaomi: MiMo-V2-Flash	5.00	9.99	50.0%	0		63	0

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	2.00	4.96	33.3%	2		2,705	6,975
Xiaomi: MiMo-V2-Flash	2.00	7.36	11.1%	1		65,754	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		275	3,802
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		272	0

Cambiar par de comparación

Comparar StepFun: Step 3.5 Flash contra...

Comparar Xiaomi: MiMo-V2-Flash contra...