#14

GLM 5

Z.ai Rilis: 2026-02-12 Diuji pada: 2026-04-22 12:55 z-ai/glm-5::medium

(medium) (none)

Ringkasan

GLM 5 mendapat skor 8.4 di AI BENCHY dan berada di peringkat #14. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 85.2%, total biaya $0.155, dan waktu respons rata-rata 23.34s.

Yang membuat GLM 5 unik: Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

8.4

Konsistensi

8.2

Keandalan

T/A

Total biaya (harga saat ini)

$0.155

Total token output

78,500

Total token input

Harga input

$0.650 / 1M

Harga output

$2.080 / 1M

Tes benar

Tes Salah: 5

Tingkat lulus per percobaan: 85.2%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

23.34s

Waktu respons (maks): 79.09s

Waktu respons (total): 233.40s

Jawaban salah: 2 Tidak mengikuti instruksi: 1 Tidak ada jawaban: 1 Kedaluwarsa: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#14 GLM 5

medium

Biaya: $0.005
Waktu: 20.7s
Token: 2,068 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:07 Tes baru ditambahkan	8.3	10.0	$0.228 ↓	Bandingkan
2026-05-21 23:44 Uji ulang	8.2	10.0	$0.237	Bandingkan
2026-04-22 12:55 Run pertama yang tercatat	8.4	T/A	$0.155	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

GLM 5mediumvsGLM 5.2medium GLM 5mediumvsGPT-5 Minimedium GLM 5mediumvsClaude Opus 4.7medium GLM 5mediumvsGPT-5.4medium GLM 5mediumvsClaude Opus 4.8medium GLM 5mediumvsSeed-2.0-Litemedium GLM 5mediumvsGemini 3.5 Flashhigh GLM 5mediumvsGemini 3 Flash Previewmedium GLM 5mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis GLM 5mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Pemrograman	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	7.1	5.6
Spesifik domain	3.5	4.4
Kecerdasan umum	6.1	3.1
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	10.0	10.0
Pemanggilan alat	10.0	10.0

GLM 5

Hamster playing table tennis

#14 GLM 5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan