AI BENCHY
Comparar
❤️ Made by XCS

Nome do modelo

xAI: Grok 4.1 Fast

Benchmarks gerados a partir das suítes de teste do Aibenchy em : 19 de fev. de 2026

Métrica xAI: Grok 4.1 Fast
Posição#24
EmpresaX Ai
Score 3.25
Consistência 9.17
Custo por resultado 0.1074
Custo total $0.00323
Testes corretos 3/12
Taxa de acerto por tentativa 30.6%
Testes instáveis 1
Tokens de saída 500
Tokens de raciocínio 0

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Custo
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00026
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00166
Domain specific 1/3 4.00 7.21 55.6% 1 - $0.00044
Instructions following 0/2 1.00 10.00 0.0% 0 - $0.00036
Puzzle Solving 0/3 1.00 9.48 0.0% 0 - $0.00053

Modelos comparados

Comparar xAI: Grok 4.1 Fast com...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

Sem raciocínio

Score: 3.25

Consistência: 8.75

Taxa de acerto por tentativa: 27.8%

Testes instáveis: 2

Custo por resultado: 0.0351

Testes corretos: 2/12

Custo total: $0.00071

Comparar

#25 · Qwen

Qwen: Qwen3 Coder Next

Raciocínio (medium)

Score: 3.08

Consistência: 8.80

Taxa de acerto por tentativa: 22.2%

Testes instáveis: 2

Custo por resultado: 0.0944

Testes corretos: 2/12

Custo total: $0.00189

Comparar

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

Sem raciocínio

Score: 3.42

Consistência: 9.28

Taxa de acerto por tentativa: 30.6%

Testes instáveis: 1

Custo por resultado: 0.2049

Testes corretos: 3/12

Custo total: $0.00615

Comparar

Comparação rápida

Comparar xAI: Grok 4.1 Fast com...