Claude Opus 4.7 (medium) vs GLM 5.2 (medium)

Recommended model Claude Opus 4.7 (medium)

It has the best score here (8.7), while responding about 3.1x faster than GLM 5.2 (medium).

Detailed comparison

Metric	Claude Opus 4.7 Claude Opus 4.7 medium Release: 2026-04-16	GLM 5.2 GLM 5.2 medium Release: 2026-06-17

Metric	Claude Opus 4.7 Claude Opus 4.7 medium Release: 2026-04-16	GLM 5.2 GLM 5.2 medium Release: 2026-06-17
Score	8.7	7.8
Rank	#21	#49
Reliability	10.0	9.5
Consistency	9.6	8.0
Benchmark coverage	22/22 tests · 66/66 attempts	21/22 tests · 63/66 attempts
Tests Correct
Attempt pass rate	83.3%	80.3%
Flaky tests	1	4
Total Runs	66	63
Cost per result	8.201	2.159
Total Cost	$1.477	$0.066
Input Price	$5.000 / 1M	$0.285 / 1M
Output Price	$25.000 / 1M	$0.894 / 1M
Total Input Tokens	145,252	37,199
Output Tokens	24,948	12,261
Reasoning Tokens	5,042	49,500
Response Time (avg)	7.61s	23.28s
Response Time (max)	65.40s	101.36s
Response Time (total)	159.91s	488.94s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
GLM 5.2	5.0	5.0	50.0%	0		51.96s	12,696	458	4,531

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

Switch Comparison Pair