AI BENCHY Compare

Google: Gemini 3.5 Flash vs Xiaomi: MiMo-V2.5-Pro

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-21

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash medium Lanzamiento: 2026-05-19	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash medium Lanzamiento: 2026-05-19	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22
Puntuación	9.0	8.1
Rango	#5	#17
Fiabilidad	10.0	10.0
Consistencia	10.0	9.2
Pruebas correctas
Tasa de aciertos por intento	85.0%	74.1%
Pruebas inestables	0	2
Ejecuciones totales	60	54
Costo por resultado	3.947	1.661
Costo total	$0.671	$0.200
Precio de entrada	$1.500 / 1M	$1.000 / 1M
Precio de salida	$9.000 / 1M	$3.000 / 1M
Tokens de salida	1,995	2,790
Tokens de razonamiento	66,890	52,001
Tiempo de respuesta (promedio)	5.76s	16.23s
Tiempo de respuesta (máximo)	41.16s	84.22s
Tiempo de respuesta (total)	115.29s	292.10s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	171	3,385
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	323	1,179

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	7.3	9.9	50.0%	0		24.69s	455	35,421
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		32.58s	543	7,485

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		12.05s	351	7,807
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	279	3,784
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	12	8,047
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	115	1,144
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	155	163

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	71	2,855
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	295	2,747
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	234	455
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	12	1,245
MiMo-V2.5-Pro	-	-	-	-	-	-	-	-

Comparación rápida

Cambiar par de comparación

Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3 Flash PreviewlowvsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5-Promedium Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash LitelowvsMiMo-V2.5-Promedium GPT-5.3 ChatnonevsMiMo-V2.5-Promedium DeepSeek V4 FlashhighDisponible gratisvsMiMo-V2.5-Promedium GPT-5.5lowvsMiMo-V2.5-Promedium