DeepSeek V4 Flash (high) vs GLM 5.2 (medium)

Recommended model DeepSeek V4 Flash (high)

Its score stays close to the best score here (7.7 vs 7.8), while costing about 2.9x less than GLM 5.2 (medium).

Detailed comparison

Metric	DeepSeek V4 Flash DeepSeek V4 Flash high Release: 2026-04-24	GLM 5.2 GLM 5.2 medium Release: 2026-06-17

Metric	DeepSeek V4 Flash DeepSeek V4 Flash high Release: 2026-04-24	GLM 5.2 GLM 5.2 medium Release: 2026-06-17
Score	7.7	7.8
Rank	#57	#49
Reliability	10.0	9.5
Consistency	8.2	8.0
Tests Correct
Attempt pass rate	72.7%	80.3%
Flaky tests	5	4
Total Runs	66	63
Cost per result	0.402	2.159
Total Cost	$0.060	$0.176
Input Price	$0.140 / 1M	$0.761 / 1M
Output Price	$0.280 / 1M	$2.389 / 1M
Total Input Tokens	108,392	37,199
Output Tokens	14,478	12,261
Reasoning Tokens	153,687	49,500
Response Time (avg)	49.75s	23.28s
Response Time (max)	218.13s	101.36s
Response Time (total)	1094.41s	488.94s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GLM 5.2	5.0	5.0	50.0%	0		51.96s	12,696	458	4,531

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

Switch Comparison Pair