Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-04-20 vs Xiaomi: MiMo-V2.5

Resumen

Comparación benchmark de Qwen3.5 Plus 2026-04-20 vs MiMo-V2.5: Qwen3.5 Plus 2026-04-20 lidera en puntuación media con 5.7 vs 4.9. MiMo-V2.5 tiene menor coste de benchmark con $0.007 vs $0.032. MiMo-V2.5 es más rápido con 2.20s vs 4.39s, con tasas de acierto de 41.3% vs 27.0%.

Modelo recomendado: MiMo-V2.5 - Ofrece el mejor equilibrio general: puntuación competitiva (4.9), menor coste que Qwen3.5 Plus 2026-04-20 y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-04

Métrica Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Lanzamiento: 2026-04-20 MiMo-V2.5 MiMo-V2.5 none Lanzamiento: 2026-04-22
Puntuación 5.7 4.9
Rango #114 #143
Fiabilidad 10.0 10.0
Consistencia 8.6 9.6
Pruebas correctas
Tasa de aciertos por intento 41.3% 27.0%
Pruebas inestables 4 1
Ejecuciones totales 63 63
Costo por resultado 0.595 0.413
Costo total $0.032 $0.007
Precio de entrada $0.300 / 1M $0.140 / 1M
Precio de salida $1.800 / 1M $0.280 / 1M
Total de tokens de entrada 38,910 41,985
Tokens de salida 11,145 2,267
Tokens de razonamiento 0 0
Tiempo de respuesta (promedio) 4.39s 2.20s
Tiempo de respuesta (máximo) 33.34s 6.86s
Tiempo de respuesta (total) 92.26s 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#114 Qwen3.5 Plus 2026-04-20

none
Cost
$0.008
Time
77.0s
Tokens
4,369 tok

#143 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 4.8 10.0 25.0% 0 1.88s 696 557 0
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 3.9 7.8 11.1% 1 1.69s 7,913 480 0
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 2.8 1.6 33.3% 1 13.32s 11,350 2,275 0
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 2.82s 7,794 243 0
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 5.3 10.0 33.3% 0 4.43s 789 18 0
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 4.8 10.0 0.0% 0 1.41s 522 119 0
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 6.2 5.8 66.7% 1 1.17s 711 68 0
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 6.7 7.9 55.6% 1 1.97s 714 583 0
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 4.42s 8,211 297 0
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Qwen3.5 Plus 2026-04-20 3.0 10.0 0.0% 0 33.34s 210 6,505 0
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0

Comparación rápida

Cambiar par de comparación