AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

Last updated at: 2026-04-29

Metric	Seed-2.0-Lite Seed-2.0-Lite medium Release: 2026-02-14	GLM 5 GLM 5 none Release: 2026-02-12

Metric	Seed-2.0-Lite Seed-2.0-Lite medium Release: 2026-02-14	GLM 5 GLM 5 none Release: 2026-02-12
Score	8.6	6.6
Rank	#10	#70
Reliability	N/A	N/A
Consistency	8.8	9.6
Tests Correct
Attempt pass rate	83.3%	51.9%
Flaky tests	3	1
Total Runs	54	54
Cost per result	0.926	0.217
Total Cost	$0.121	$0.020
Input Price	$0.250 / 1M	$0.600 / 1M
Output Price	$2.000 / 1M	$2.080 / 1M
Output Tokens	3,257	1,959
Reasoning Tokens	52,042	0
Response Time (avg)	30.37s	4.23s
Response Time (max)	168.71s	11.07s
Response Time (total)	546.72s	46.51s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
GLM 5	5.6	3.5	33.3%	1		8.84s	408	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
GLM 5	7.7	10.0	66.7%	0		2.05s	264	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

Quick Compare

Switch Comparison Pair

Grok 4.1 FastmediumvsGLM 5none Nemotron 3 SupermediumFree AvailablevsGLM 5none Seed-2.0-LitemediumvsHY3 PreviewhighFree Available DeepSeek V4 ProhighvsGLM 5none Mercury 2mediumvsGLM 5none Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Laguna M.1mediumFree AvailablevsGLM 5none Grok 4.20mediumvsGLM 5none Qwen3.6 27BmediumvsGLM 5none Kimi K2.5mediumvsGLM 5none GPT-5 MinimediumvsGLM 5none GPT-5 NanomediumvsGLM 5none