AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

MoonshotAI: Kimi K2.5

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek MoonshotAI: Kimi K2.5
Rang#9
BedrijfMoonshotAI
Score 6.42
Consistentie 8.00
Kosten per resultaat 2.4097
Totale kosten $0.16868
Correcte tests 7/12
Slaagpercentage per poging 72.2%
Instabiele tests 3
Uitvoer-tokens 30,235
Redeneer-tokens 53,179

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

Vergeleken modellen

Vergelijk MoonshotAI: Kimi K2.5 met...

#8 · X Ai

xAI: Grok 4.1 Fast

Redenering (medium)

Score: 6.42

Consistentie: 8.60

Slaagpercentage per poging: 66.7%

Instabiele tests: 2

Kosten per resultaat: 0.4800

Correcte tests: 7/12

Totale kosten: $0.03360

Vergelijken

#10 · Google

Google: Gemini 3 Flash Preview

Zonder redenering

Score: 6.25

Consistentie: 8.60

Slaagpercentage per poging: 66.7%

Instabiele tests: 2

Kosten per resultaat: 0.0754

Correcte tests: 7/12

Totale kosten: $0.00528

Vergelijken

#7 · Z.ai

Z.ai: GLM 5

Redenering (medium)

Score: 6.83

Consistentie: 7.86

Slaagpercentage per poging: 80.6%

Instabiele tests: 3

Kosten per resultaat: 1.3424

Correcte tests: 8/12

Totale kosten: $0.10740

Vergelijken

Snelle vergelijking

Vergelijk MoonshotAI: Kimi K2.5 met...