Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Mimo V2 Omni

Resumo

Comparação benchmark Gemini 3 Flash Preview vs Mimo V2 Omni: Gemini 3 Flash Preview lidera na pontuação média com 9.6 vs 6.8. Gemini 3 Flash Preview tem menor custo de benchmark com $0.667 vs $0.683. Gemini 3 Flash Preview é mais rápido com 18.64s vs 41.16s, com taxas de acerto de 98.4% vs 55.6%.

Modelo recomendado: Gemini 3 Flash Preview - Tem a melhor pontuação aqui (9.6) e responde cerca de 2.2x mais rápido que Mimo V2 Omni.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18

Métrica Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lançamento: 2025-12-17 Mimo V2 Omni Mimo V2 Omni medium Lançamento: 2026-03-18
Pontuação 9.6 6.8
Posição #2 #73
Confiabilidade 10.0 10.0
Consistência 9.7 8.7
Testes corretos
Taxa de acerto por tentativa 98.4% 55.6%
Testes instáveis 1 3
Execuções totais 63 55
Custo por resultado 3.335 7.334
Custo total $0.667 $0.683
Preço de entrada $0.500 / 1M $1.722 / 1M
Preço de saída $3.000 / 1M $1.722 / 1M
Total de tokens de entrada 37,017 37,007
Tokens de saída 2,006 1,952
Tokens de raciocínio 214,153 357,306
Tempo de resposta (médio) 18.64s 41.16s
Tempo de resposta (máx.) 117.26s 299.23s
Tempo de resposta (total) 391.35s 823.26s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium
Custo
$0.010
Tempo
17.9s
Tokens
3,236 tok

#73 Mimo V2 Omni

medium
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5
Custo
$0.000
Tempo
0.1s
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Mimo V2 Omni 10.0 10.0 100.0% 0 2.75s 621 269 1,701
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
Mimo V2 Omni 3.3 6.5 11.1% 1 183.89s 4,787 292 174,314
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Mimo V2 Omni 10.0 10.0 100.0% 0 25.87s 15,060 380 8,673
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Mimo V2 Omni 10.0 10.0 100.0% 0 3.04s 6,002 155 591
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Mimo V2 Omni 3.0 10.0 0.0% 0 47.89s 735 155 68,398
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Mimo V2 Omni 5.4 2.5 66.7% 1 3.61s 492 136 492
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Mimo V2 Omni 8.3 10.0 50.0% 0 4.99s 470 49 515
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Mimo V2 Omni 5.9 7.2 55.6% 1 2.38s 410 210 860
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Mimo V2 Omni 10.0 10.0 100.0% 0 13.98s 8,220 303 3,461
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Mimo V2 Omni 3.0 10.0 0.0% 0 234.19s 210 3 98,301

Comparação rápida

Trocar par de comparação