AI BENCHY
Comparar
❤️ Made by XCS

Nome do modelo

Xiaomi: MiMo-V2-Flash

Benchmarks gerados a partir das suítes de teste do Aibenchy em : 19 de fev. de 2026

Métrica Xiaomi: MiMo-V2-Flash
Posição#21
EmpresaXiaomi
Score 3.92
Consistência 7.89
Custo por resultado 0.4829
Custo total $0.01932
Testes corretos 4/12
Taxa de acerto por tentativa 44.4%
Testes instáveis 3
Tokens de saída 10,095
Tokens de raciocínio 63,833

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Custo
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 9.73 $0.00140
Data parsing and extraction 1/2 5.50 10.00 50.0% 0 7.00 $0.00029
Domain specific 1/3 4.00 7.21 55.6% 1 8.72 $0.01477
Instructions following 1/2 5.00 5.80 66.7% 1 9.33 $0.00035
Puzzle Solving 0/3 1.00 7.14 11.1% 1 8.06 $0.00254

Modelos comparados

Comparar Xiaomi: MiMo-V2-Flash com...

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Raciocínio (medium)

Score: 3.92

Consistência: 6.51

Taxa de acerto por tentativa: 50.0%

Testes instáveis: 5

Custo por resultado: 0.2253

Testes corretos: 4/12

Custo total: $0.00902

Comparar

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

Sem raciocínio

Score: 3.42

Consistência: 9.28

Taxa de acerto por tentativa: 30.6%

Testes instáveis: 1

Custo por resultado: 0.2049

Testes corretos: 3/12

Custo total: $0.00615

Comparar

#19 · OpenAI

OpenAI: GPT-4o-mini

Sem raciocínio

Score: 4.00

Consistência: 9.98

Taxa de acerto por tentativa: 25.0%

Testes instáveis: 0

Custo por resultado: 0.0576

Testes corretos: 3/12

Custo total: $0.00173

Comparar

Comparação rápida

Comparar Xiaomi: MiMo-V2-Flash com...