AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Xiaomi: MiMo-V2.5-Pro

Resumen

Comparación benchmark de Qwen3.5-35B-A3B vs MiMo-V2.5-Pro: Qwen3.5-35B-A3B lidera en puntuación media con 6.3 vs 5.5. MiMo-V2.5-Pro tiene menor coste de benchmark con $0.017 vs $0.401. MiMo-V2.5-Pro es más rápido con 1.78s vs 72.57s, con tasas de acierto de 69.8% vs 39.7%.

Modelo recomendado: MiMo-V2.5-Pro - Su puntuación se mantiene cerca de la mejor aquí (5.5 vs 6.3) y cuesta aproximadamente 25.0x menos que Qwen3.5-35B-A3B.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-02

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24	MiMo-V2.5-Pro MiMo-V2.5-Pro none Lanzamiento: 2026-04-22

Métrica	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lanzamiento: 2026-02-24	MiMo-V2.5-Pro MiMo-V2.5-Pro none Lanzamiento: 2026-04-22
Puntuación	6.3	5.5
Rango	#92	#123
Fiabilidad	10.0	10.0
Consistencia	7.5	8.6
Pruebas correctas
Tasa de aciertos por intento	69.8%	39.7%
Pruebas inestables	6	4
Ejecuciones totales	63	63
Costo por resultado	5.162	0.648
Costo total	$0.401	$0.017
Precio de entrada	$0.140 / 1M	$0.435 / 1M
Precio de salida	$1.000 / 1M	$0.870 / 1M
Total de tokens de entrada	42,196	30,724
Tokens de salida	40,630	3,043
Tokens de razonamiento	353,577	0
Tiempo de respuesta (promedio)	72.57s	1.78s
Tiempo de respuesta (máximo)	409.98s	8.32s
Tiempo de respuesta (total)	1524.04s	37.42s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#92 Qwen3.5-35B-A3B

medium

Coste: $0.009
Tiempo: 71.4s
Tokens: 8,631 tok

#123 MiMo-V2.5-Pro

none

Coste: $0.004
Tiempo: 46.4s
Tokens: 4,025 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	645	994	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462
MiMo-V2.5-Pro	4.3	7.8	22.2%	1		1.41s	6,559	485	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	4,695	596	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	7,758	249	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	753	27	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	498	87	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	684	66	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.30s	678	267	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	8,238	258	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	216	14	0

Comparación rápida

Cambiar par de comparación