AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Z.ai: GLM 5V Turbo

Last updated at: 2026-05-10

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview none Release: 2025-12-17	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview none Release: 2025-12-17	GLM 5V Turbo GLM 5V Turbo medium Release: 2026-04-01
Score	7.9	7.5
Rank	#29	#49
Reliability	10.0	10.0
Consistency	9.1	7.6
Tests Correct
Attempt pass rate	73.7%	73.7%
Flaky tests	2	6
Total Runs	57	57
Cost per result	0.157	2.919
Total Cost	$0.021	$0.322
Input Price	$0.500 / 1M	$1.200 / 1M
Output Price	$3.000 / 1M	$4.000 / 1M
Output Tokens	1,855	2,373
Reasoning Tokens	0	66,463
Response Time (avg)	1.61s	16.33s
Response Time (max)	3.56s	67.08s
Response Time (total)	19.26s	310.29s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	8.3	10.0	75.0%	0		1.25s	214	0
GLM 5V Turbo	7.2	6.1	75.0%	2		10.76s	587	7,872

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.59s	423	0
GLM 5V Turbo	10.0	10.0	100.0%	0		13.78s	404	4,628

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	4.7	1.6	66.7%	1		3.56s	350	0
GLM 5V Turbo	6.9	3.8	66.7%	1		15.06s	403	2,523

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.41s	279	0
GLM 5V Turbo	10.0	10.0	100.0%	0		9.60s	236	4,333

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	7.7	10.0	66.7%	0		963ms	18	0
GLM 5V Turbo	5.3	7.2	44.4%	1		38.15s	32	29,035

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.13s	104	0
GLM 5V Turbo	10.0	10.0	100.0%	0		11.09s	131	2,183

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	6.4	5.8	66.7%	1		1.58s	74	0
GLM 5V Turbo	9.9	10.0	100.0%	0		3.74s	72	1,813

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	7.7	10.0	66.7%	0		1.06s	144	0
GLM 5V Turbo	7.6	7.2	77.8%	1		10.91s	193	5,789

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.35s	234	0
GLM 5V Turbo	7.0	3.7	66.7%	1		12.53s	293	765

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		1.07s	15	0
GLM 5V Turbo	3.0	10.0	0.0%	0		40.96s	22	7,522

Quick Compare

Switch Comparison Pair

Gemini 3 Flash PreviewnonevsQwen3.5-122B-A10Bmedium Gemini 3 Flash PreviewnonevsMiMo-V2.5medium DeepSeek V4 FlashhighvsGLM 5V Turbomedium Gemini 3 Flash PreviewnonevsQwen3.6 Plusmedium GPT-5.3 ChatnonevsGLM 5V Turbomedium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-04-20medium Claude Sonnet 4.6mediumvsGemini 3 Flash Previewnone Gemini 3 Flash PreviewnonevsGPT-5.4medium Gemini 3.1 Flash LitelowvsGLM 5V Turbomedium Gemini 3 Flash PreviewnonevsGrok 4.3medium GPT-5.2 ChatnonevsGLM 5V Turbomedium Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium