AI BENCHY Compare

HY3 Preview vs Z.ai: GLM 5V Turbo

Last updated at: 2026-05-01

Metric	HY3 Preview HY3 Preview low Release: 2026-04-22 Free Available	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01

Metric	HY3 Preview HY3 Preview low Release: 2026-04-22 Free Available	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01
Score	8.1	7.8
Rank	#29	#44
Reliability	N/A	N/A
Consistency	9.5	7.5
Tests Correct
Attempt pass rate	75.9%	77.8%
Flaky tests	1	6
Total Runs	50	54
Cost per result	0.000	2.643
Total Cost	$0.000	$0.291
Input Price	$0.000 / 1M	$1.200 / 1M
Output Price	$0.000 / 1M	$4.000 / 1M
Output Tokens	65,778	2,351
Reasoning Tokens	0	58,941
Response Time (avg)	23.98s	14.96s
Response Time (max)	78.74s	67.08s
Response Time (total)	407.72s	269.32s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		16.61s	7,905	0
GLM 5V Turbo	7.2	6.1	75.0%	2		10.76s	587	7,872

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		27.94s	7,907	0
GLM 5V Turbo	10.0	10.0	100.0%	0		13.78s	404	4,628

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		78.74s	12,975	0
GLM 5V Turbo	6.9	3.8	66.7%	1		15.06s	403	2,523

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	6.5	10.0	50.0%	0		5.85s	1,022	0
GLM 5V Turbo	10.0	10.0	100.0%	0		9.60s	236	4,333

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	5.9	7.2	55.6%	1		40.44s	23,121	0
GLM 5V Turbo	5.3	7.2	44.4%	1		38.15s	32	29,035

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		16.44s	2,185	0
GLM 5V Turbo	10.0	10.0	100.0%	0		11.09s	131	2,183

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		15.98s	2,475	0
GLM 5V Turbo	9.9	10.0	100.0%	0		3.74s	72	1,813

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	5.3	10.0	33.3%	0		13.73s	6,985	0
GLM 5V Turbo	7.7	7.3	77.8%	1		10.91s	193	5,789

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
HY3 Preview	10.0	10.0	100.0%	0		17.84s	1,203	0
GLM 5V Turbo	7.0	3.7	66.7%	1		12.53s	293	765

Quick Compare

Switch Comparison Pair

Gemini 3 Flash PreviewnonevsHY3 PreviewlowFree Available Qwen3.6 PlusmediumvsHY3 PreviewlowFree Available Qwen3.5-122B-A10BmediumvsHY3 PreviewlowFree Available Qwen3.6 FlashmediumvsHY3 PreviewlowFree Available DeepSeek V4 FlashhighvsGLM 5V Turbomedium HY3 PreviewlowFree AvailablevsGLM 5 Turbomedium HY3 PreviewlowFree AvailablevsMiMo-V2.5-Promedium HY3 PreviewlowFree AvailablevsMiMo-V2-Promedium Qwen3.5 Plus 2026-04-20mediumvsHY3 PreviewlowFree Available GPT-5.3 ChatnonevsGLM 5V Turbomedium Gemma 4 26B A4BmediumFree AvailablevsHY3 PreviewlowFree Available Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewlowFree Available