Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lançamento: 2026-05-08 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lançamento: 2026-04-22
Pontuação 7.7 7.6
Posição #35 #40
Confiabilidade 10.0 10.0
Consistência 9.2 8.9
Testes corretos
Taxa de acerto por tentativa 68.3% 68.3%
Testes instáveis 2 3
Execuções totais 60 60
Custo por resultado 0.500 2.407
Custo total $0.065 $0.289
Preço de entrada $0.250 / 1M $1.000 / 1M
Preço de saída $1.500 / 1M $3.000 / 1M
Tokens de saída 2,248 4,957
Tokens de raciocínio 35,390 80,301
Tempo de resposta (médio) 3.18s 21.77s
Tempo de resposta (máx.) 10.87s 130.77s
Tempo de resposta (total) 63.55s 435.33s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 9.1 10.0 75.0% 0 2.39s 604 4,201
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 3.59s 453 6,068
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 10.87s 327 7,401
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 279 2,845
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 3.16s 15 5,165
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 84 1,142
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 9.9 10.0 100.0% 0 2.59s 75 3,320
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 7.6 7.2 77.8% 1 1.95s 165 2,450
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 4.55s 234 921
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 3.08s 12 1,877
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

Comparação rápida

Trocar par de comparação