AI BENCHY
Vergelijken
❤️ Made by XCS
Your ad here

Modelnaam

MoonshotAI: Kimi K2.5

Zonder redenering

Benchmarks gegenereerd uit AI BENCHY-testsuites op : 24 feb 2026

Metriek MoonshotAI: Kimi K2.5
Rang#24
BedrijfMoonshotAI
Score 3.62
Consistentie 8.84
Kosten per resultaat 0.2413
Totale kosten $0.00725
Correcte tests
Slaagpercentage per poging 30.8%
Instabiele tests 2
Uitvoer-tokens 1,695
Redeneer-tokens 0
Responstijd (gem.)11378ms
Responstijd (totaal)11378ms
Responstijd (max)11378ms

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Responstijd (gem.) Kosten
Anti-AI-trucs 2.67 7.86 11.1% 1 - 11378ms $0.00121
Gegevensparsering en extractie 5.50 5.81 83.3% 1 - 0ms $0.00455
Domeinspecifiek 4.00 10.00 33.3% 0 - 0ms $0.00027
Instructies opvolgen 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

Vergeleken modellen

Vergelijk MoonshotAI: Kimi K2.5 met...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

Redenering (medium)

Score: 3.69

Consistentie: 6.15

Slaagpercentage per poging: 48.7%

Instabiele tests: 6

Kosten per resultaat: 0.2600

Correcte tests:

Totale kosten: $0.01041

Vergelijken

#25 · X Ai

xAI: Grok 4.1 Fast

Zonder redenering

Score: 3.15

Consistentie: 9.24

Slaagpercentage per poging: 28.2%

Instabiele tests: 1

Kosten per resultaat: 0.1153

Correcte tests:

Totale kosten: $0.00346

Vergelijken

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

Redenering (medium)

Score: 3.77

Consistentie: 7.46

Slaagpercentage per poging: 43.6%

Instabiele tests: 4

Kosten per resultaat: 0.5072

Correcte tests:

Totale kosten: $0.02029

Vergelijken

Snelle vergelijking

Vergelijk MoonshotAI: Kimi K2.5 met...