Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Xiaomi: MiMo-V2.5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica Gemma 4 26B A4B Gemma 4 26B A4B medium Lançamento: 2026-04-03 Disponível grátis MiMo-V2.5 MiMo-V2.5 medium Lançamento: 2026-04-22
Pontuação 7.7 7.8
Posição #43 #37
Confiabilidade 10.0 10.0
Consistência 8.7 8.6
Testes corretos
Taxa de acerto por tentativa 73.7% 75.9%
Testes instáveis 3 3
Execuções totais 57 54
Custo por resultado 0.260 2.101
Custo total $0.034 $0.253
Preço de entrada $0.060 / 1M $0.400 / 1M
Preço de saída $0.330 / 1M $2.000 / 1M
Tokens de saída 16,725 2,821
Tokens de raciocínio 61,536 116,207
Tempo de resposta (médio) 33.69s 14.40s
Tempo de resposta (máx.) 180.87s 86.93s
Tempo de resposta (total) 606.35s 259.20s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 1,142 3,045
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.8 10.0 0.0% 0 147.47s 3,516 4,676
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 5,415 13,112
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 1,567 2,827
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 2,469 7,105
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 25 5,075
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 887 4,470
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 7.7 7.3 77.8% 1 8.52s 457 3,065
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 450 1,256
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 797 16,905
MiMo-V2.5 - - - - - - - -

Comparação rápida

Trocar par de comparação