DeepSeek V4 Pro (high) vs GLM 5.2 (medium)

Recommended model GLM 5.2 (medium)

It has the best score here (7.8), while responding about 3.4x faster than DeepSeek V4 Pro (high).

Detailed comparison

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GLM 5.2 GLM 5.2 medium Release: 2026-06-17

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GLM 5.2 GLM 5.2 medium Release: 2026-06-17
Score	7.7	7.8
Rank	#58	#49
Reliability	10.0	9.5
Consistency	7.7	8.0
Tests Correct
Attempt pass rate	63.6%	80.3%
Flaky tests	6	4
Total Runs	66	63
Cost per result	2.000	2.159
Total Cost	$0.200	$0.176
Input Price	$0.435 / 1M	$0.761 / 1M
Output Price	$0.870 / 1M	$2.389 / 1M
Total Input Tokens	90,748	37,199
Output Tokens	10,462	12,261
Reasoning Tokens	178,719	49,500
Response Time (avg)	79.14s	23.28s
Response Time (max)	416.76s	101.36s
Response Time (total)	1740.97s	488.94s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404
GLM 5.2	5.0	5.0	50.0%	0		51.96s	12,696	458	4,531

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

Switch Comparison Pair