AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

Z.ai: GLM 4.7 Flash

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek Z.ai: GLM 4.7 Flash
Rang#20
BedrijfZ.ai
Score 3.92
Consistentie 6.51
Kosten per resultaat 0.2253
Totale kosten $0.00902
Correcte tests 4/12
Slaagpercentage per poging 50.0%
Instabiele tests 5
Uitvoer-tokens 7,601
Redeneer-tokens 18,390

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

Vergeleken modellen

Vergelijk Z.ai: GLM 4.7 Flash met...

#19 · OpenAI

OpenAI: GPT-4o-mini

Zonder redenering

Score: 4.00

Consistentie: 9.98

Slaagpercentage per poging: 25.0%

Instabiele tests: 0

Kosten per resultaat: 0.0576

Correcte tests: 3/12

Totale kosten: $0.00173

Vergelijken

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Redenering (medium)

Score: 3.92

Consistentie: 7.89

Slaagpercentage per poging: 44.4%

Instabiele tests: 3

Kosten per resultaat: 0.4829

Correcte tests: 4/12

Totale kosten: $0.01932

Vergelijken

#18 · Stepfun

StepFun: Step 3.5 Flash

Redenering (medium)

Score: 4.92

Consistentie: 7.34

Slaagpercentage per poging: 58.3%

Instabiele tests: 4

Kosten per resultaat: 0.0000

Correcte tests: 5/12

Totale kosten: $0.00000

Vergelijken

Snelle vergelijking

Vergelijk Z.ai: GLM 4.7 Flash met...