AI BENCHY
Compară
❤️ Made by XCS

Nume model

xAI: Grok 4.1 Fast

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică xAI: Grok 4.1 Fast
Rang#8
CompanieX Ai
Score 6.42
Consistență 8.60
Cost per rezultat 0.4800
Cost total $0.03360
Teste corecte 7/12
Rată de trecere pe încercare 66.7%
Teste instabile 2
Tokenuri de ieșire 437
Tokenuri de raționament 61,090

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 4.00 $0.00151
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.00 $0.00438
Domain specific 1/3 4.00 7.21 55.6% 1 5.00 $0.02064
Instructions following 1/2 5.50 10.00 50.0% 0 3.25 $0.00191
Puzzle Solving 1/3 4.67 7.20 44.4% 1 8.50 $0.00518

Modele comparate

Compară xAI: Grok 4.1 Fast cu...

#7 · Z.ai

Z.ai: GLM 5

Raționament (medium)

Score: 6.83

Consistență: 7.86

Rată de trecere pe încercare: 80.6%

Teste instabile: 3

Cost per rezultat: 1.3424

Teste corecte: 8/12

Cost total: $0.10740

Compară

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

Raționament (medium)

Score: 6.42

Consistență: 8.00

Rată de trecere pe încercare: 72.2%

Teste instabile: 3

Cost per rezultat: 2.4097

Teste corecte: 7/12

Cost total: $0.16868

Compară

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Raționament (medium)

Score: 7.00

Consistență: 9.30

Rată de trecere pe încercare: 69.4%

Teste instabile: 1

Cost per rezultat: 9.3797

Teste corecte: 8/12

Cost total: $0.75038

Compară

Comparație rapidă

Compară xAI: Grok 4.1 Fast cu...