AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2-Omni

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-08

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lançamento: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lançamento: 2026-03-18

Métrica	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lançamento: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lançamento: 2026-03-18
Pontuação	7.9	6.3
Posição	#27	#79
Confiabilidade	10.0	10.0
Consistência	9.1	9.7
Testes corretos
Taxa de acerto por tentativa	71.9%	43.9%
Testes instáveis	2	1
Execuções totais	57	49
Custo por resultado	0.452	0.241
Custo total	$0.059	$0.020
Preço de entrada	$0.250 / 1M	$0.400 / 1M
Preço de saída	$1.500 / 1M	$2.000 / 1M
Tokens de saída	2,224	2,254
Tokens de raciocínio	32,034	0
Tempo de resposta (médio)	3.14s	2.37s
Tempo de resposta (máx.)	10.87s	6.81s
Tempo de resposta (total)	59.62s	45.03s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	604	4,201
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.26s	429	2,712
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		10.87s	327	7,401
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	279	2,845
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	15	5,165
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	84	1,142
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	75	3,320
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	165	2,450
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	234	921
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	12	1,877
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparação rápida

Trocar par de comparação

Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponível grátisvsMiMo-V2-Omninone Gemini 3.1 Flash LitemediumvsGPT-5.2 Chatnone Owl AlphamediumvsMiMo-V2-Omninone Gemini 3.1 Flash LitemediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGemini 3.1 Flash Litemedium Qwen3.6 27BmediumvsMiMo-V2-Omninone CobuddymediumDisponível grátisvsMiMo-V2-Omninone Kimi K2.5mediumvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsMiMo-V2-Omninone