AI BENCHY
Compară
❤️ Made by XCS

Nume model

Z.ai: GLM 4.7 Flash

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică Z.ai: GLM 4.7 Flash
Rang#20
CompanieZ.ai
Score 3.92
Consistență 6.51
Cost per rezultat 0.2253
Cost total $0.00902
Teste corecte 4/12
Rată de trecere pe încercare 50.0%
Teste instabile 5
Tokenuri de ieșire 7,601
Tokenuri de raționament 18,390

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

Modele comparate

Compară Z.ai: GLM 4.7 Flash cu...

#19 · OpenAI

OpenAI: GPT-4o-mini

Fără raționament

Score: 4.00

Consistență: 9.98

Rată de trecere pe încercare: 25.0%

Teste instabile: 0

Cost per rezultat: 0.0576

Teste corecte: 3/12

Cost total: $0.00173

Compară

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Raționament (medium)

Score: 3.92

Consistență: 7.89

Rată de trecere pe încercare: 44.4%

Teste instabile: 3

Cost per rezultat: 0.4829

Teste corecte: 4/12

Cost total: $0.01932

Compară

#18 · Stepfun

StepFun: Step 3.5 Flash

Raționament (medium)

Score: 4.92

Consistență: 7.34

Rată de trecere pe încercare: 58.3%

Teste instabile: 4

Cost per rezultat: 0.0000

Teste corecte: 5/12

Cost total: $0.00000

Compară

Comparație rapidă

Compară Z.ai: GLM 4.7 Flash cu...