Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Xiaomi: MiMo-V2.5

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-28

Métrica Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24 MiMo-V2.5 MiMo-V2.5 medium Lanzamiento: 2026-04-22
Puntuación 7.3 7.4
Rango #65 #57
Fiabilidad 10.0 10.0
Consistencia 7.5 8.4
Pruebas correctas
Tasa de aciertos por intento 73.3% 70.0%
Pruebas inestables 6 4
Ejecuciones totales 60 60
Costo por resultado 4.865 2.876
Costo total $0.368 $0.052
Precio de entrada $0.139 / 1M $0.140 / 1M
Precio de salida $1.000 / 1M $0.280 / 1M
Tokens de salida 31,242 2,806
Tokens de razonamiento 330,546 161,888
Tiempo de respuesta (promedio) 69.66s 20.35s
Tiempo de respuesta (máximo) 409.98s 97.49s
Tiempo de respuesta (total) 1393.17s 406.94s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 6.5 10.0 50.0% 0 244.54s 14,456 88,431
MiMo-V2.5 6.9 6.2 66.7% 1 64.48s 536 44,967
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 3,592 26,585
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 279 33,254
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 10,919 72,053
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 22 15,484

Comparación rápida

Cambiar par de comparación