AI BENCHY Compare

Z.ai: GLM 5.2 vs Z.ai: GLM 5V Turbo

Summary

GLM 5.2 vs GLM 5V Turbo benchmark comparison: GLM 5V Turbo leads on average score with 7.3 vs 7.1. GLM 5.2 has the lower benchmark cost at $0.076 vs $0.457. GLM 5.2 is faster at 6.34s vs 23.08s, with pass rates of 60.3% vs 68.3%.

Recommended model: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.3), while costing about 6.1x less than GLM 5V Turbo.

Last updated at: 2026-06-17

Metric	GLM 5.2 GLM 5.2 none Release: 2026-06-17	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01

Metric	GLM 5.2 GLM 5.2 none Release: 2026-06-17	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01
Score	7.1	7.3
Rank	#61	#56
Reliability	9.9	10.0
Consistency	9.6	7.9
Tests Correct
Attempt pass rate	60.3%	68.3%
Flaky tests	1	6
Total Runs	63	63
Cost per result	0.628	4.151
Total Cost	$0.076	$0.457
Input Price	$1.400 / 1M	$1.200 / 1M
Output Price	$4.400 / 1M	$4.000 / 1M
Total Input Tokens	38,671	44,615
Output Tokens	4,817	2,347
Reasoning Tokens	0	98,415
Response Time (avg)	6.34s	23.08s
Response Time (max)	20.69s	95.88s
Response Time (total)	133.19s	484.63s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 GLM 5.2

none

Invalid SVG

Cost: $0.033
Time: 87.7s
Tokens: 7,455 tok

#56 GLM 5V Turbo

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0
GLM 5V Turbo	7.2	6.1	75.0%	2		10.76s	555	587	7,872

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0
GLM 5V Turbo	6.0	7.2	55.6%	1		63.38s	7,256	440	37,873

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0
GLM 5V Turbo	6.9	3.8	66.7%	1		15.06s	18,533	403	2,523

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0
GLM 5V Turbo	10.0	10.0	100.0%	0		9.60s	7,107	236	4,333

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0
GLM 5V Turbo	5.3	7.2	44.4%	1		38.15s	687	32	29,035

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0
GLM 5V Turbo	10.0	10.0	100.0%	0		11.09s	477	131	2,183

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0
GLM 5V Turbo	9.9	10.0	100.0%	0		3.74s	636	72	1,813

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0
GLM 5V Turbo	7.7	10.0	66.7%	0		10.24s	609	131	4,496

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0
GLM 5V Turbo	7.0	3.7	66.7%	1		12.53s	8,569	293	765

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0
GLM 5V Turbo	3.0	10.0	0.0%	0		40.96s	186	22	7,522

Quick Compare

Switch Comparison Pair

Claude Opus 4.8nonevsGLM 5V Turbomedium Gemma 4 26B A4BmediumFree AvailablevsGLM 5.2none MiMo-V2-FlashmediumvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Claude Sonnet 4.6nonevsGLM 5V Turbomedium DeepSeek V4 PrononevsGLM 5V Turbomedium Qwen3.7 PlusnonevsGLM 5V Turbomedium Gemini 3 Flash PreviewlowvsGLM 5V Turbomedium Kimi K2.7 CodemediumvsGLM 5.2none Step 3.7 FlashhighvsGLM 5V Turbomedium Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none