Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Xiaomi: MiMo-V2-Flash

Resumo

Comparação benchmark Gemini 3 Flash Preview vs MiMo-V2-Flash: Gemini 3 Flash Preview lidera na pontuação média com 9.6 vs 7.1. MiMo-V2-Flash tem menor custo de benchmark com $0.043 vs $0.667. Gemini 3 Flash Preview é mais rápido com 18.64s vs 20.11s, com taxas de acerto de 98.4% vs 65.1%.

Modelo recomendado: Gemini 3 Flash Preview - Tem a pontuação mais forte nesta comparação (9.6) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 2 modelos.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-02

Métrica Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lançamento: 2025-12-17 MiMo-V2-Flash MiMo-V2-Flash medium Lançamento: 2025-12-16
Pontuação 9.6 7.1
Posição #2 #64
Confiabilidade 10.0 10.0
Consistência 9.7 8.8
Testes corretos
Taxa de acerto por tentativa 98.4% 65.1%
Testes instáveis 1 3
Execuções totais 63 63
Custo por resultado 3.335 0.343
Custo total $0.667 $0.043
Preço de entrada $0.500 / 1M $0.100 / 1M
Preço de saída $3.000 / 1M $0.300 / 1M
Total de tokens de entrada 37,017 40,111
Tokens de saída 2,006 12,476
Tokens de raciocínio 214,153 125,039
Tempo de resposta (médio) 18.64s 20.11s
Tempo de resposta (máx.) 117.26s 96.01s
Tempo de resposta (total) 391.35s 301.59s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium
Custo
$0.010
Tempo
17.9s
Tokens
3,236 tok

#64 MiMo-V2-Flash

medium
SVG inválido
Custo
$0.020
Tempo
284.1s
Tokens
65,689 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

Comparação rápida

Trocar par de comparação