AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Mimo V2 Omni

Resumen

Comparación benchmark de Gemini 3 Flash Preview vs Mimo V2 Omni: Gemini 3 Flash Preview lidera en puntuación media con 9.6 vs 6.8. Gemini 3 Flash Preview tiene menor coste de benchmark con $0.667 vs $0.683. Gemini 3 Flash Preview es más rápido con 18.64s vs 41.16s, con tasas de acierto de 98.4% vs 55.6%.

Modelo recomendado: Gemini 3 Flash Preview - Tiene la mejor puntuación aquí (9.6) y responde aproximadamente 2.2x más rápido que Mimo V2 Omni.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lanzamiento: 2025-12-17	Mimo V2 Omni Mimo V2 Omni medium Lanzamiento: 2026-03-18

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lanzamiento: 2025-12-17	Mimo V2 Omni Mimo V2 Omni medium Lanzamiento: 2026-03-18
Puntuación	9.6	6.8
Rango	#2	#73
Fiabilidad	10.0	10.0
Consistencia	9.7	8.7
Pruebas correctas
Tasa de aciertos por intento	98.4%	55.6%
Pruebas inestables	1	3
Ejecuciones totales	63	55
Costo por resultado	3.335	7.334
Costo total	$0.667	$0.683
Precio de entrada	$0.500 / 1M	$1.722 / 1M
Precio de salida	$3.000 / 1M	$1.722 / 1M
Total de tokens de entrada	37,017	37,007
Tokens de salida	2,006	1,952
Tokens de razonamiento	214,153	357,306
Tiempo de respuesta (promedio)	18.64s	41.16s
Tiempo de respuesta (máximo)	117.26s	299.23s
Tiempo de respuesta (total)	391.35s	823.26s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium

Coste: $0.010
Tiempo: 17.9s
Tokens: 3,236 tok

#73 Mimo V2 Omni

medium

This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5

Coste: $0.000
Tiempo: 0.1s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.88s	494	330	3,216
Mimo V2 Omni	10.0	10.0	100.0%	0		2.75s	621	269	1,701

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	8.6	7.6	88.9%	1		84.40s	8,122	462	161,084
Mimo V2 Omni	3.3	6.5	11.1%	1		183.89s	4,787	292	174,314

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		22.42s	12,873	351	10,485
Mimo V2 Omni	10.0	10.0	100.0%	0		25.87s	15,060	380	8,673

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.43s	7,548	279	4,893
Mimo V2 Omni	10.0	10.0	100.0%	0		3.04s	6,002	155	591

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		15.27s	633	12	21,684
Mimo V2 Omni	3.0	10.0	0.0%	0		47.89s	735	155	68,398

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.19s	486	72	1,905
Mimo V2 Omni	5.4	2.5	66.7%	1		3.61s	492	136	492

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.04s	615	72	2,709
Mimo V2 Omni	8.3	10.0	50.0%	0		4.99s	470	49	515

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.05s	558	183	4,365
Mimo V2 Omni	5.9	7.2	55.6%	1		2.38s	410	210	860

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		12.60s	5,532	234	1,487
Mimo V2 Omni	10.0	10.0	100.0%	0		13.98s	8,220	303	3,461

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.50s	156	11	2,325
Mimo V2 Omni	3.0	10.0	0.0%	0		234.19s	210	3	98,301

Comparación rápida

Cambiar par de comparación