Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15

Métrica Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lançamento: 2026-03-03 MiMo-V2-Flash MiMo-V2-Flash medium Lançamento: 2025-12-16
Posição #16 #18
Pontuação 8.0 7.9
Consistência 10.0 9.5
Custo por resultado 0.443 0.316
Custo total $0.049 $0.035
Testes corretos
Taxa de acerto por tentativa 68.8% 72.9%
Testes instáveis 0 1
Execuções totais 48 48
Tokens de saída 1,731 11,613
Tokens de raciocínio 25,821 106,714
Tempo de resposta (médio) 3.83s 25.33s
Tempo de resposta (máx.) 14.93s 96.01s
Tempo de resposta (total) 61.25s 253.33s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 8.8 10.0 66.7% 0 2.53s 564 3,780
MiMo-V2-Flash 9.9 10.0 100.0% 0 16.79s 1,328 18,739
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 14.93s 327 7,347
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.29s 279 2,952
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 4.21s 18 5,325
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.16s 96 1,488
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.91s 72 2,121
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 3.58s 141 1,896
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.80s 234 912
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

Comparação rápida

Trocar par de comparação