DeepSeek: DeepSeek V4 Flash vs Z.ai: GLM 5

GLM 5 (medium) unggul dalam skor rata-rata dengan 7.7 vs 7.7. DeepSeek V4 Flash (high) memiliki biaya benchmark lebih rendah di $0.041 vs $0.307. GLM 5 (medium) lebih cepat di 33.54s vs 49.75s, dengan tingkat keberhasilan 72.7% vs 78.8%.

Model yang direkomendasikanDeepSeek V4 Flash (high)Its score stays close to the best score here (7.7 vs 7.7), while costing about 7.7x less than GLM 5 (medium).

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-07-25

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24	GLM 5 GLM 5 medium Rilis: 2026-02-12

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24	GLM 5 GLM 5 medium Rilis: 2026-02-12
Skor	7.7	7.7
Peringkat	#52	#49
Keandalan	10.0	10.0
Konsistensi	8.2	8.1
Tes benar
Tingkat lulus per percobaan	72.7%	78.8%
Tes tidak stabil	5	4
Total Run	66	63
Biaya per hasil	0.402	1.668
Total Biaya	$0.041	$0.307
Harga input	$0.094 / 1M	$0.950 / 1M
Harga output	$0.188 / 1M	$2.551 / 1M
Total token input	108,392	35,224
Token output	14,478	21,570
Token penalaran	153,687	102,996
Waktu respons (rata-rata)	49.75s	33.54s
Waktu respons (maks)	218.13s	99.85s
Waktu respons (total)	1094.41s	435.99s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Biaya: $0.003
Waktu: 93.1s
Token: 7,926 tok

#49 GLM 5

medium

Biaya: $0.005
Waktu: 20.7s
Token: 2,068 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GLM 5	5.0	5.0	50.0%	0		28.96s	12,804	662	3,242

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Perbandingan Cepat

Ganti Pasangan Perbandingan

GPT-5.6 LunahighvsGLM 5medium Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Claude Opus 4.8lowvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 FlashhighvsGrok Build 0.1medium Claude Opus 4.8lowvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGPT-5.6 Lunamedium DeepSeek V4 FlashhighvsNemotron 3 UltramediumTersedia gratis Claude Opus 5nonevsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsKimi K2.7 Codemedium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium