Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Z.ai: GLM 5.1

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-20

Metriek Kimi K2.6 Kimi K2.6 medium Releasedatum: 2026-04-20 GLM 5.1 GLM 5.1 medium Releasedatum: 2026-04-07
Score 7.7 7.8
Rang #34 #33
Consistentie 8.3 8.6
Correcte tests
Slaagpercentage per poging 74.1% 75.9%
Instabiele tests 4 3
Totaal runs 54 54
Kosten per resultaat 6.563 1.674
Totale kosten $0.722 $0.201
Invoerprijs $0.950 / 1M $1.050 / 1M
Uitvoerprijs $4.000 / 1M $3.500 / 1M
Uitvoer-tokens 80,759 8,005
Redeneer-tokens 179,814 49,090
Responstijd (gem.) 45.20s 24.13s
Responstijd (max) 215.85s 118.52s
Responstijd (totaal) 768.37s 410.25s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 106.96s 3,236 18,817
GLM 5.1 4.7 1.6 66.7% 1 118.52s 1,339 13,777
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 5.0 5.2 44.5% 2 25.59s 14,140 17,868
GLM 5.1 8.2 7.2 88.9% 1 23.85s 899 5,627
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0

Snelle vergelijking

Vergelijkingspaar wisselen