Compare Charts

Language:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5

Compare:

Last updated at: 2026-03-03

Metric	Google: Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Z.ai: GLM 5 medium Release: 2026-02-12
Rank	#10	#13
Avg Score	7.70	7.29
Consistency	9.54	8.18
Cost per result	0.116	1.196
Total Cost	$0.011	$0.120
Tests Correct
Attempt pass rate	69.1%	83.3%
Flaky tests	1	3
Output Tokens	4,307	15,923
Reasoning Tokens	0	42,557

Top Models by Score

Score vs Total Cost

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		420	4,992

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
Z.ai: GLM 5	5.00	5.62	83.3%	1		567	3,734

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
Z.ai: GLM 5	1.00	4.41	33.3%	2		14,404	24,570

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
Z.ai: GLM 5	9.50	9.99	100.0%	0		140	2,740

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		159	5,527

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
Z.ai: GLM 5	10.00	10.00	100.0%	0		233	994

Quick Compare

Switch Comparison Pair

GPT-5.3 ChatnonevsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewhighvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumFree Available DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium