Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Omni

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-21

Métrica Step 3.5 Flash Step 3.5 Flash medium Lanzamiento: 2026-02-01 Disponible gratis MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18
Puntuación 7.9 6.4
Rango #24 #43
Consistencia 9.1 10.0
Pruebas correctas
Tasa de aciertos por intento 70.6% 47.1%
Pruebas inestables 2 0
Ejecuciones totales 49 17
Costo por resultado 0.000 0.069
Costo total $0.000 $0.006
Precio de entrada $0.100 / 1M $0.400 / 1M
Precio de salida $0.300 / 1M $2.000 / 1M
Tokens de salida 71,904 469
Tokens de razonamiento 155,607 0
Tiempo de respuesta (promedio) 26.78s 2.01s
Tiempo de respuesta (máximo) 170.45s 6.81s
Tiempo de respuesta (total) 294.58s 34.09s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

Comparación rápida

Cambiar par de comparación