DeepSeek V4 Pro (high) vs GLM 5 (medium)

Recommended model GLM 5 (medium)

It has the best score here (7.7), while responding about 2.4x faster than DeepSeek V4 Pro (high).

Detailed comparison

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GLM 5 GLM 5 medium Release: 2026-02-12

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GLM 5 GLM 5 medium Release: 2026-02-12
Score	7.7	7.7
Rank	#58	#54
Reliability	10.0	10.0
Consistency	7.7	8.1
Tests Correct
Attempt pass rate	63.6%	78.8%
Flaky tests	6	4
Total Runs	66	63
Cost per result	2.000	1.668
Total Cost	$0.200	$0.307
Input Price	$0.435 / 1M	$0.950 / 1M
Output Price	$0.870 / 1M	$2.551 / 1M
Total Input Tokens	90,748	35,224
Output Tokens	10,462	21,570
Reasoning Tokens	178,719	102,996
Response Time (avg)	79.14s	33.54s
Response Time (max)	416.76s	99.85s
Response Time (total)	1740.97s	435.99s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404
GLM 5	5.0	5.0	50.0%	0		28.96s	12,804	662	3,242

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Switch Comparison Pair