Navegação
AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica Google: Gemini 3.1 Flash Lite Preview low Lançamento: 2026-03-03 Xiaomi: MiMo-V2-Flash medium Lançamento: 2025-12-16
Pontuação média 7.6 7.5
Posição #12 #17
Testes corretos
Consistência 10.0 9.4
Custo por resultado 0.170 0.314
Custo total $0.019 $0.035
Taxa de acerto por tentativa 73.3% 77.8%
Testes instáveis 0 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
Tokens de saída 1,542 11,526
Tokens de raciocínio 6,888 106,226
Tempo de resposta (médio) 3.49s 27.68s
Tempo de resposta (máx.) 11.91s 96.01s
Tempo de resposta (total) 52.29s 249.14s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
Xiaomi: MiMo-V2-Flash 9.7 10.0 100.0% 0 16.79s 1,328 18,739
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
Xiaomi: MiMo-V2-Flash 9.0 10.0 100.0% 0 75.68s 442 26,859
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
Xiaomi: MiMo-V2-Flash 5.5 10.0 50.0% 0 0ms 153 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
Xiaomi: MiMo-V2-Flash 4.0 7.2 55.6% 1 96.01s 8,374 42,461
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Xiaomi: MiMo-V2-Flash 7.0 10.0 66.7% 0 3.77s 833 1,948
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

Comparação rápida

Trocar par de comparação