Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Xiaomi: MiMo-V2-Omni

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-14

Métrica Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24 MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18
Puntuación 7.4 6.5
Rango #40 #52
Consistencia 6.7 10.0
Pruebas correctas
Tasa de aciertos por intento 79.6% 44.4%
Pruebas inestables 7 0
Ejecuciones totales 54 20
Costo por resultado 3.976 0.083
Costo total $0.398 $0.007
Precio de entrada $0.163 / 1M $0.400 / 1M
Precio de salida $1.300 / 1M $2.000 / 1M
Tokens de salida 10,137 868
Tokens de razonamiento 208,761 0
Tiempo de respuesta (promedio) 44.51s 1.99s
Tiempo de respuesta (máximo) 106.00s 6.81s
Tiempo de respuesta (total) 801.21s 35.81s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 79.09s 4,273 33,078
MiMo-V2-Omni 6.6 10.0 0.0% 0 1.72s 399 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

Comparación rápida

Cambiar par de comparación