AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Xiaomi: MiMo-V2-Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica	Qwen3.5-Flash Qwen3.5-Flash medium Lanzamiento: 2026-02-24	MiMo-V2-Flash MiMo-V2-Flash medium Lanzamiento: 2025-12-16

Métrica	Qwen3.5-Flash Qwen3.5-Flash medium Lanzamiento: 2026-02-24	MiMo-V2-Flash MiMo-V2-Flash medium Lanzamiento: 2025-12-16
Puntuación	7.6	7.2
Rango	#50	#61
Fiabilidad	6.7	10.0
Consistencia	7.5	8.7
Pruebas correctas
Tasa de aciertos por intento	77.2%	66.7%
Pruebas inestables	6	3
Ejecuciones totales	57	57
Costo por resultado	0.807	0.341
Costo total	$0.089	$0.038
Precio de entrada	$0.065 / 1M	$0.100 / 1M
Precio de salida	$0.260 / 1M	$0.300 / 1M
Tokens de salida	2,105	12,399
Tokens de razonamiento	228,936	115,182
Tiempo de respuesta (promedio)	65.79s	21.71s
Tiempo de respuesta (máximo)	234.29s	96.01s
Tiempo de respuesta (total)	1250.00s	282.29s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	10.0	10.0	100.0%	0		59.11s	383	32,992
MiMo-V2-Flash	8.1	7.9	83.3%	1		15.85s	1,674	23,559

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	4.7	1.6	66.7%	1		45.75s	246	12,600
MiMo-V2-Flash	4.7	1.6	66.7%	1		13.03s	428	3,648

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	10.0	10.0	100.0%	0		17.78s	483	8,270
MiMo-V2-Flash	9.8	10.0	100.0%	0		75.68s	442	26,859

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	7.3	5.9	83.3%	1		56.99s	235	16,237
MiMo-V2-Flash	6.5	10.0	50.0%	0		0ms	153	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	5.3	7.2	44.4%	1		146.50s	58	43,615
MiMo-V2-Flash	5.9	7.2	55.6%	1		96.01s	8,374	42,461

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	6.1	3.1	66.7%	1		40.05s	99	38,486
MiMo-V2-Flash	4.0	10.0	0.0%	0		4.20s	87	488

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	10.0	10.0	100.0%	0		63.49s	98	14,139
MiMo-V2-Flash	10.0	10.0	100.0%	0		4.28s	75	3,504

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	6.6	4.6	77.8%	2		56.74s	162	24,276
MiMo-V2-Flash	7.7	10.0	66.7%	0		3.77s	833	1,948

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	10.0	10.0	100.0%	0		10.33s	309	1,284
MiMo-V2-Flash	10.0	10.0	100.0%	0		27.78s	321	12,715

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Qwen3.5-Flash	3.0	10.0	0.0%	0		48.98s	32	37,037
MiMo-V2-Flash	3.0	10.0	0.0%	0		1.96s	12	0

Comparación rápida

Cambiar par de comparación

Ring-2.6-1TnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash LitelowvsQwen3.5-Flashmedium Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium GPT-5.3 ChatnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsQwen3.5-Flashmedium DeepSeek V4 FlashhighDisponible gratisvsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-Flashmedium Gemini 3 Flash PreviewnonevsQwen3.5-Flashmedium DeepSeek V4 FlashhighDisponible gratisvsMiMo-V2-Flashmedium GPT-5.3 ChatnonevsMiMo-V2-Flashmedium