Qwen3 Coder Next (medium) vs GLM 4.7 Flash

Recommended model GLM 4.7 Flash

It has the best score here (4.9), while costing about 2.1x less than Qwen3 Coder Next (medium).

Detailed comparison

Metric	Qwen3 Coder Next Qwen3 Coder Next medium Release: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash none Release: 2026-01-19

Metric	Qwen3 Coder Next Qwen3 Coder Next medium Release: 2026-02-03	GLM 4.7 Flash GLM 4.7 Flash none Release: 2026-01-19
Score	4.7	4.9
Rank	#209	#197
Reliability	10.0	10.0
Consistency	9.0	8.9
Tests Correct
Attempt pass rate	27.3%	34.9%
Flaky tests	3	3
Total Runs	66	66
Cost per result	0.793	0.256
Total Cost	$0.032	$0.016
Input Price	$0.110 / 1M	$0.060 / 1M
Output Price	$0.800 / 1M	$0.400 / 1M
Total Input Tokens	148,194	101,504
Output Tokens	19,069	22,992
Reasoning Tokens	0	0
Response Time (avg)	9.61s	9.15s
Response Time (max)	81.80s	97.15s
Response Time (total)	153.69s	137.18s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Invalid SVG

none

Invalid SVG

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	555	438	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0
GLM 4.7 Flash	4.3	10.0	0.0%	0		2.54s	7,256	650	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	3.0	10.0	0.0%	0		14.65s	121,413	16,067	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		50.18s	77,084	21,175	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	7,107	196	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	687	19	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	477	134	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	636	62	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0
GLM 4.7 Flash	6.4	10.0	33.3%	0		1.20s	609	97	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	6,907	212	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		692ms	186	9	0

Switch Comparison Pair