Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

Modelos comparados

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-26

Métrica MiMo-V2.5 MiMo-V2.5 medium Lanzamiento: 2026-04-22 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22 MiMo-V2-Omni MiMo-V2-Omni medium Lanzamiento: 2026-03-18 MiMo-V2-Pro MiMo-V2-Pro medium Lanzamiento: 2026-03-18
Puntuación 7.8 8.1 7.7 8.1
Rango #41 #27 #43 #28
Fiabilidad N/D N/D N/D N/D
Consistencia 8.6 8.8 9.9 8.6
Pruebas correctas
Tasa de aciertos por intento 74.1% 75.9% 61.1% 77.8%
Pruebas inestables 3 3 0 3
Ejecuciones totales 54 54 20 48
Costo por resultado 2.102 1.674 1.383 1.320
Costo total $0.253 $0.201 $0.153 $0.159
Precio de entrada $0.400 / 1M $1.000 / 1M $0.400 / 1M $1.000 / 1M
Precio de salida $2.000 / 1M $3.000 / 1M $2.000 / 1M $3.000 / 1M
Tokens de salida 2,840 2,735 928 2,360
Tokens de razonamiento 116,242 52,571 72,661 38,320
Tiempo de respuesta (promedio) 13.71s 16.17s 16.76s 12.27s
Tiempo de respuesta (máximo) 86.93s 84.22s 158.78s 64.71s
Tiempo de respuesta (total) 246.73s 291.09s 301.61s 208.56s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Comparación rápida

Cambiar par de comparación