Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Xiaomi: MiMo-V2.5-Pro

Resumo

Comparação benchmark Gemma 4 26B A4B vs MiMo-V2.5-Pro: Gemma 4 26B A4B lidera na pontuação média com 7.6 vs 7.5. Gemma 4 26B A4B tem menor custo de benchmark com $0.045 vs $0.106. MiMo-V2.5-Pro é mais rápido com 26.13s vs 63.41s, com taxas de acerto de 69.8% vs 68.3%.

Modelo recomendado: Gemma 4 26B A4B - Tem a melhor pontuação aqui (7.6) e custa cerca de 2.4x menos que MiMo-V2.5-Pro.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-04

Métrica Gemma 4 26B A4B Gemma 4 26B A4B medium Lançamento: 2026-04-03 Disponível grátis MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lançamento: 2026-04-22
Pontuação 7.6 7.5
Posição #37 #43
Confiabilidade 10.0 10.0
Consistência 9.2 8.5
Testes corretos
Taxa de acerto por tentativa 69.8% 68.3%
Testes instáveis 2 4
Execuções totais 63 63
Custo por resultado 0.361 2.541
Custo total $0.045 $0.106
Preço de entrada $0.060 / 1M $0.435 / 1M
Preço de saída $0.330 / 1M $0.870 / 1M
Total de tokens de entrada 40,252 40,854
Tokens de saída 28,000 5,015
Tokens de raciocínio 100,490 97,742
Tempo de resposta (médio) 63.41s 26.13s
Tempo de resposta (máx.) 369.32s 130.77s
Tempo de resposta (total) 1268.28s 548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Gemma 4 26B A4B

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#43 MiMo-V2.5-Pro

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

Comparação rápida

Trocar par de comparação