#37

GLM 5.1

Z.ai Rilis: 2026-04-07 Diuji pada: 2026-04-22 12:55 z-ai/glm-5.1::medium

(medium) (none)

Ringkasan

GLM 5.1 mendapat skor 7.8 di AI BENCHY dan berada di peringkat #37. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 75.9%, total biaya $0.201, dan waktu respons rata-rata 24.13s.

Yang membuat GLM 5.1 unik: Model ini paling menonjol di Spesifik domain, dengan peringkat #3, sementara Pemrograman adalah area terlemahnya di #18.

Skor

7.8

Konsistensi

8.6

Keandalan

T/A

Total biaya (harga saat ini)

$0.201

Total token output

57,095

Total token input

Harga input

$1.050 / 1M

Harga output

$3.500 / 1M

Tes benar

Tes Salah: 6

Tingkat lulus per percobaan: 75.9%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

24.13s

Waktu respons (maks): 118.52s

Waktu respons (total): 410.25s

Jawaban salah: 3 Kedaluwarsa: 2 Kesalahan API: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 GLM 5.1

medium

SVG tidak valid

Biaya: $0.000
Waktu: 300.0s
Token: 0 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:06 Tes baru ditambahkan	7.3	6.7	$0.292 ↓	Bandingkan
2026-05-21 23:46 Suite berubah	7.4	3.3	$0.286	Bandingkan
2026-05-08 14:41 Suite berubah	7.6	0.0	$0.209	Bandingkan
2026-05-08 14:41 Suite berubah	7.6	0.0	$0.209	Bandingkan
2026-04-22 12:55 Run pertama yang tercatat	7.8	T/A	$0.201	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

GLM 5.1mediumvsDeepSeek V4 Pronone GLM 5.1mediumvsQwen3.7 Plusnone GLM 5.1mediumvsClaude Opus 4.8none GLM 5.1mediumvsGLM 5.2none GLM 5.1mediumvsGemini 3.5 Flashhigh GLM 5.1mediumvsGemini 3 Flash Previewmedium GLM 5.1mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis GLM 5.1mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Pemrograman	4.7	1.6
Gabungan	9.5	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	6.4	5.8
Pemecahan teka-teki	8.2	7.2
Pemanggilan alat	3.0	10.0

GLM 5.1

Hamster playing table tennis

#37 GLM 5.1

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan