AI BENCHY
Comparar
❤️ Made by XCS
Your ad here

Nome do modelo

MoonshotAI: Kimi K2.5

Sem raciocínio

Benchmarks gerados a partir das suítes de teste do AI BENCHY em : 24 de fev. de 2026

Métrica MoonshotAI: Kimi K2.5
Posição#24
EmpresaMoonshotAI
Score 3.62
Consistência 8.84
Custo por resultado 0.2413
Custo total $0.00725
Testes corretos
Taxa de acerto por tentativa 30.8%
Testes instáveis 2
Tokens de saída 1,695
Tokens de raciocínio 0
Tempo de resposta (médio)11378ms
Tempo de resposta (total)11378ms
Tempo de resposta (máx.)11378ms

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Tempo de resposta (médio) Custo
Truques anti-IA 2.67 7.86 11.1% 1 - 11378ms $0.00121
Análise e extração de dados 5.50 5.81 83.3% 1 - 0ms $0.00455
Específico do domínio 4.00 10.00 33.3% 0 - 0ms $0.00027
Seguimento de instruções 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

Modelos comparados

Comparar MoonshotAI: Kimi K2.5 com...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

Raciocínio (medium)

Score: 3.69

Consistência: 6.15

Taxa de acerto por tentativa: 48.7%

Testes instáveis: 6

Custo por resultado: 0.2600

Testes corretos:

Custo total: $0.01041

Comparar

#25 · X Ai

xAI: Grok 4.1 Fast

Sem raciocínio

Score: 3.15

Consistência: 9.24

Taxa de acerto por tentativa: 28.2%

Testes instáveis: 1

Custo por resultado: 0.1153

Testes corretos:

Custo total: $0.00346

Comparar

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

Raciocínio (medium)

Score: 3.77

Consistência: 7.46

Taxa de acerto por tentativa: 43.6%

Testes instáveis: 4

Custo por resultado: 0.5072

Testes corretos:

Custo total: $0.02029

Comparar

Comparação rápida

Comparar MoonshotAI: Kimi K2.5 com...