Comparação benchmark Gemini 3 Flash Preview vs Mimo V2 PRO: Gemini 3 Flash Preview lidera na pontuação média com 9.6 vs 6.7. Mimo V2 PRO tem menor custo de benchmark com $0.333 vs $0.667. Gemini 3 Flash Preview é mais rápido com 18.64s vs 22.16s, com taxas de acerto de 98.4% vs 73.0%.
Modelo recomendado: Gemini 3 Flash Preview - Tem a pontuação mais forte nesta comparação (9.6) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 2 modelos.
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18
Mimo V2 PROMimo V2 PROmediumModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.Lançamento: 2026-03-18
Pontuação
9.6Pontuação média em todos os testes de benchmark.…
6.7Pontuação média em todos os testes de benchmark.…
Posição
#2
#77
Confiabilidade
10.0Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
9.6Pontuação de sucesso na primeira tentativa: 10.0 significa nenhum erro reexecutável da API alvo ou de limite de taxa antes de chamadas bem-sucedidas; falhas registradas reduzem a pontuação.…
Consistência
9.7A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
8.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
Testes corretos
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.64sTempo de resposta (máx.)117.26sTempo de resposta (total)391.35sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.88sTempo de resposta (máx.)5.73sTempo de resposta (total)15.53sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
3.88sTempo de resposta (médio)…
494Total de tokens de entrada…
330Tokens de saída…
3,216Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.86sTempo de resposta (máx.)3.92sTempo de resposta (total)11.45sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
8.6Pontuação média em todos os testes de benchmark.…
7.6A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
88.9%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)84.40sTempo de resposta (máx.)117.26sTempo de resposta (total)253.21sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
84.40sTempo de resposta (médio)…
8,122Total de tokens de entrada…
462Tokens de saída…
161,084Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
6.0Pontuação média em todos os testes de benchmark.…
7.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
55.6%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)94.21sTempo de resposta (máx.)136.29sTempo de resposta (total)188.41sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)22.42sTempo de resposta (máx.)22.42sTempo de resposta (total)22.42sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
22.42sTempo de resposta (médio)…
12,873Total de tokens de entrada…
351Tokens de saída…
10,485Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
4.7Pontuação média em todos os testes de benchmark.…
1.6A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
66.7%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)64.71sTempo de resposta (máx.)64.71sTempo de resposta (total)64.71sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.43sTempo de resposta (máx.)6.18sTempo de resposta (total)10.86sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.43sTempo de resposta (médio)…
7,548Total de tokens de entrada…
279Tokens de saída…
4,893Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
7.3Pontuação média em todos os testes de benchmark.…
5.8A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
83.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
1Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.20sTempo de resposta (máx.)17.44sTempo de resposta (total)34.40sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.27sTempo de resposta (máx.)34.09sTempo de resposta (total)45.80sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
15.27sTempo de resposta (médio)…
633Total de tokens de entrada…
12Tokens de saída…
21,684Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
5.3Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
33.3%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)8.82sTempo de resposta (máx.)14.48sTempo de resposta (total)26.47sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.19sTempo de resposta (máx.)5.19sTempo de resposta (total)5.19sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.19sTempo de resposta (médio)…
486Total de tokens de entrada…
72Tokens de saída…
1,905Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.92sTempo de resposta (máx.)4.92sTempo de resposta (total)4.92sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.04sTempo de resposta (máx.)4.70sTempo de resposta (total)8.08sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
4.04sTempo de resposta (médio)…
615Total de tokens de entrada…
72Tokens de saída…
2,709Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
9.9Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.36sTempo de resposta (máx.)4.35sTempo de resposta (total)6.72sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.05sTempo de resposta (máx.)5.64sTempo de resposta (total)12.15sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
4.05sTempo de resposta (médio)…
558Total de tokens de entrada…
183Tokens de saída…
4,365Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
6.4Pontuação média em todos os testes de benchmark.…
4.4A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
77.8%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
2Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Não seguiu as instruções: 1Tempo de resposta (médio)5.08sTempo de resposta (máx.)6.41sTempo de resposta (total)15.23sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.60sTempo de resposta (máx.)12.60sTempo de resposta (total)12.60sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
12.60sTempo de resposta (médio)…
5,532Total de tokens de entrada…
234Tokens de saída…
1,487Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.19sTempo de resposta (máx.)8.19sTempo de resposta (total)8.19sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
10.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
100.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.50sTempo de resposta (máx.)5.50sTempo de resposta (total)5.50sUm teste é totalmente aprovado apenas quando todas as execuções passam.…
5.50sTempo de resposta (médio)…
156Total de tokens de entrada…
11Tokens de saída…
2,325Tokens de raciocínio…
Mimo V2 PROModelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
3.0Pontuação média em todos os testes de benchmark.…
10.0A consistência reflete a estabilidade entre execuções (10 = muito consistente, mesmo que consistentemente errado).…
0.0%Taxa de acerto por tentativa = tentativas aprovadas / tentativas totais em todas as execuções.…
0Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).…
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)82.71sTempo de resposta (máx.)82.71sTempo de resposta (total)82.71sUm teste é totalmente aprovado apenas quando todas as execuções passam.…