Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	Xiaomi: MiMo-V2-Flash medium Lançamento: 2025-12-16
Pontuação média	7.1	7.2
Posição	#23	#21
Testes corretos
Consistência	9.6	9.5
Custo por resultado	0.143	0.314
Custo total	$0.015	$0.035
Taxa de acerto por tentativa	66.7%	72.9%
Testes instáveis	1	1
common.totalRuns	46 (16 x 2.88)	46 (16 x 2.88)
Tokens de saída	4,669	11,556
Tokens de raciocínio	0	106,408
Tempo de resposta (médio)	1.33s	25.25s
Tempo de resposta (máx.)	3.39s	96.01s
Tempo de resposta (total)	21.34s	252.48s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	6.0	7.8	55.6%	1		1.16s	1,086	0
Xiaomi: MiMo-V2-Flash	9.7	10.0	100.0%	0		16.79s	1,328	18,739

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	0.0%	0		3.20s	339	0
Xiaomi: MiMo-V2-Flash	9.0	10.0	100.0%	0		75.68s	442	26,859

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.9	10.0	100.0%	0		1.22s	399	0
Xiaomi: MiMo-V2-Flash	5.5	10.0	50.0%	0		0ms	153	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	4.0	10.0	33.3%	0		942ms	568	0
Xiaomi: MiMo-V2-Flash	4.0	7.2	55.6%	1		96.01s	8,374	42,461

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		808ms	23	0
Xiaomi: MiMo-V2-Flash	3.0	10.0	0.0%	0		3.34s	30	182

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	574	0
Xiaomi: MiMo-V2-Flash	10.0	10.0	100.0%	0		4.28s	75	3,504

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		972ms	898	0
Xiaomi: MiMo-V2-Flash	7.0	10.0	66.7%	0		3.77s	833	1,948

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	782	0
Xiaomi: MiMo-V2-Flash	10.0	10.0	100.0%	0		27.78s	321	12,715

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone GPT-5.3 ChatnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponível grátis Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium