AI BENCHY
Bandingkan
❤️ Made by XCS

Nama Model

Z.ai: GLM 4.7 Flash

Benchmark dihasilkan dari suite pengujian Aibenchy pada : 19 Feb 2026

Metrik Z.ai: GLM 4.7 Flash
Peringkat#20
PerusahaanZ.ai
Score 3.92
Konsistensi 6.51
Biaya per hasil 0.2253
Total Biaya $0.00902
Tes benar 4/12
Tingkat lulus per percobaan 50.0%
Tes tidak stabil 5
Token output 7,601
Token penalaran 18,390

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Biaya
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

Model yang Dibandingkan

Bandingkan Z.ai: GLM 4.7 Flash dengan...

#19 · OpenAI

OpenAI: GPT-4o-mini

Tanpa penalaran

Score: 4.00

Konsistensi: 9.98

Tingkat lulus per percobaan: 25.0%

Tes tidak stabil: 0

Biaya per hasil: 0.0576

Tes benar: 3/12

Total Biaya: $0.00173

Bandingkan

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Penalaran (medium)

Score: 3.92

Konsistensi: 7.89

Tingkat lulus per percobaan: 44.4%

Tes tidak stabil: 3

Biaya per hasil: 0.4829

Tes benar: 4/12

Total Biaya: $0.01932

Bandingkan

#18 · Stepfun

StepFun: Step 3.5 Flash

Penalaran (medium)

Score: 4.92

Konsistensi: 7.34

Tingkat lulus per percobaan: 58.3%

Tes tidak stabil: 4

Biaya per hasil: 0.0000

Tes benar: 5/12

Total Biaya: $0.00000

Bandingkan

Perbandingan Cepat

Bandingkan Z.ai: GLM 4.7 Flash dengan...