Qwen: Qwen3.6 Flash vs Xiaomi: MiMo-V2.5-Pro

La puntuación media está prácticamente empatada en 6.9 vs 6.9. MiMo-V2.5-Pro (medium) tiene menor coste de benchmark con $0.187 vs $0.738. MiMo-V2.5-Pro (medium) es más rápido con 33.92s vs 44.65s, con tasas de acierto de 68.2% vs 66.7%.

Modelo recomendadoMiMo-V2.5-Pro (medium)Tiene la mejor puntuación aquí (6.9) y cuesta aproximadamente 4.0x menos que Qwen3.6 Flash (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-21

Métrica	Qwen3.6 Flash Qwen3.6 Flash medium Lanzamiento: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22

Métrica	Qwen3.6 Flash Qwen3.6 Flash medium Lanzamiento: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22
Puntuación	6.9	6.9
Rango	#89	#88
Fiabilidad	10.0	10.0
Consistencia	8.2	8.2
Pruebas correctas
Tasa de aciertos por intento	68.2%	66.7%
Pruebas inestables	5	5
Ejecuciones totales	66	66
Costo por resultado	6.784	3.218
Costo total	$0.738	$0.187
Precio de entrada	$0.188 / 1M	$0.435 / 1M
Precio de salida	$1.125 / 1M	$0.870 / 1M
Total de tokens de entrada	129,041	139,883
Tokens de salida	20,026	15,521
Tokens de razonamiento	614,312	130,992
Tiempo de respuesta (promedio)	44.65s	33.92s
Tiempo de respuesta (máximo)	578.13s	197.54s
Tiempo de respuesta (total)	982.32s	746.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#89 Qwen3.6 Flash

medium

SVG inválido

Coste: $0.008
Tiempo: 29.9s
Tokens: 6,784 tok

#88 MiMo-V2.5-Pro

medium

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.10s	672	624	14,024
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	5.0	5.1	44.5%	2		42.85s	7,895	495	67,967
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	6.5	10.0	50.0%	0		299.21s	101,613	17,514	382,793
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	10.0	10.0	100.0%	0		9.65s	7,782	270	13,155
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	3.5	4.4	33.3%	2		14.65s	771	60	24,409
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	4.8	9.9	0.0%	0		9.88s	516	140	5,445
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.05s	699	102	7,423
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	8.2	7.2	88.9%	1		6.29s	696	460	10,860
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	10.0	10.0	100.0%	0		4.00s	8,193	335	1,188
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.6 Flash	3.0	10.0	0.0%	0		122.87s	204	26	87,048
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Comparación rápida

Cambiar par de comparación

GPT-5.6 SolnonevsMiMo-V2.5-Promedium Qwen3.6 FlashmediumvsStep 3.7 Flashhigh GPT-5.5nonevsQwen3.6 Flashmedium DeepSeek V4 PrononevsMiMo-V2.5-Promedium GPT-5.6 SolnonevsQwen3.6 Flashmedium Step 3.7 FlashhighvsMiMo-V2.5-Promedium GPT-5.5nonevsMiMo-V2.5-Promedium DeepSeek V4 PrononevsQwen3.6 Flashmedium Gemini 3.5 FlashminimalvsQwen3.6 Flashmedium Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium Gemini 3.5 FlashnonevsQwen3.6 Flashmedium