Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Z.ai: GLM 5 Turbo

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-15

Metriek Step 3.5 Flash Step 3.5 Flash medium Releasedatum: 2026-02-01 Gratis beschikbaar GLM 5 Turbo GLM 5 Turbo medium Releasedatum: 2026-03-15
Rang #25 #20
Score 7.8 7.9
Consistentie 9.1 7.7
Kosten per resultaat 0.000 1.641
Totale kosten $0.000 $0.165
Correcte tests
Slaagpercentage per poging 68.8% 75.0%
Instabiele tests 2 5
Totaal runs 48 48
Uitvoer-tokens 71,452 11,853
Redeneer-tokens 155,147 35,095
Responstijd (gem.) 29.10s 18.84s
Responstijd (max) 170.45s 194.23s
Responstijd (totaal) 290.96s 301.50s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

Snelle vergelijking

Vergelijkingspaar wisselen