AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2-Omni

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-08

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lanzamiento: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lanzamiento: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lanzamiento: 2026-03-18
Puntuación	7.9	6.3
Rango	#27	#79
Fiabilidad	10.0	10.0
Consistencia	9.1	9.7
Pruebas correctas
Tasa de aciertos por intento	71.9%	43.9%
Pruebas inestables	2	1
Ejecuciones totales	57	49
Costo por resultado	0.452	0.241
Costo total	$0.059	$0.020
Precio de entrada	$0.250 / 1M	$0.400 / 1M
Precio de salida	$1.500 / 1M	$2.000 / 1M
Tokens de salida	2,224	2,254
Tokens de razonamiento	32,034	0
Tiempo de respuesta (promedio)	3.14s	2.37s
Tiempo de respuesta (máximo)	10.87s	6.81s
Tiempo de respuesta (total)	59.62s	45.03s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	604	4,201
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.26s	429	2,712
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		10.87s	327	7,401
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	279	2,845
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	15	5,165
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	84	1,142
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	75	3,320
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	165	2,450
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	234	921
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	12	1,877
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparación rápida

Cambiar par de comparación

Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponible gratisvsMiMo-V2-Omninone Gemini 3.1 Flash LitemediumvsGPT-5.2 Chatnone Owl AlphamediumvsMiMo-V2-Omninone Gemini 3.1 Flash LitemediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGemini 3.1 Flash Litemedium Qwen3.6 27BmediumvsMiMo-V2-Omninone CobuddymediumDisponible gratisvsMiMo-V2-Omninone Kimi K2.5mediumvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsMiMo-V2-Omninone