AI BENCHY
Comparar
❤️ Made by XCS

Nome do modelo

MoonshotAI: Kimi K2.5

Benchmarks gerados a partir das suítes de teste do Aibenchy em : 19 de fev. de 2026

Métrica MoonshotAI: Kimi K2.5
Posição#9
EmpresaMoonshotAI
Score 6.42
Consistência 8.00
Custo por resultado 2.4097
Custo total $0.16868
Testes corretos 7/12
Taxa de acerto por tentativa 72.2%
Testes instáveis 3
Tokens de saída 30,235
Tokens de raciocínio 53,179

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Custo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

Modelos comparados

Comparar MoonshotAI: Kimi K2.5 com...

#8 · X Ai

xAI: Grok 4.1 Fast

Raciocínio (medium)

Score: 6.42

Consistência: 8.60

Taxa de acerto por tentativa: 66.7%

Testes instáveis: 2

Custo por resultado: 0.4800

Testes corretos: 7/12

Custo total: $0.03360

Comparar

#10 · Google

Google: Gemini 3 Flash Preview

Sem raciocínio

Score: 6.25

Consistência: 8.60

Taxa de acerto por tentativa: 66.7%

Testes instáveis: 2

Custo por resultado: 0.0754

Testes corretos: 7/12

Custo total: $0.00528

Comparar

#7 · Z.ai

Z.ai: GLM 5

Raciocínio (medium)

Score: 6.83

Consistência: 7.86

Taxa de acerto por tentativa: 80.6%

Testes instáveis: 3

Custo por resultado: 1.3424

Testes corretos: 8/12

Custo total: $0.10740

Comparar

Comparação rápida

Comparar MoonshotAI: Kimi K2.5 com...