AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5.1

Muhtasari

Ulinganisho wa benchmark Grok 4.20 vs GLM 5.1: Grok 4.20 inaongoza kwa average score: 7.3 vs 7.1. GLM 5.1 ina gharama ya chini ya benchmark: $0.292 vs $0.609. Grok 4.20 ni ya haraka zaidi: 27.68s vs 33.67s, na pass rates 63.5% vs 68.3%.

Muundo unaopendekezwa: GLM 5.1 - Its score stays close to the best score here (7.1 vs 7.3), while costing about 2.1x less than Grok 4.20.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18

Kipimo	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31	GLM 5.1 GLM 5.1 medium Toleo: 2026-04-07

Kipimo	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31	GLM 5.1 GLM 5.1 medium Toleo: 2026-04-07
Alama	7.3	7.1
Nafasi	#53	#64
Uaminifu	10.0	6.7
Uthabiti	8.8	8.3
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio	63.5%	68.3%
Majaribio yasiyo thabiti	3	4
Jumla ya uendeshaji	63	63
Gharama kwa matokeo	8.309	2.496
Jumla ya gharama	$0.609	$0.292
Bei ya ingizo	$1.250 / 1M	$0.980 / 1M
Bei ya toleo	$2.500 / 1M	$3.080 / 1M
Jumla ya tokeni za ingizo	44,433	32,995
Tokeni za matokeo	1,819	11,655
Tokeni za hoja	219,524	75,421
Muda wa majibu (wastani)	27.68s	33.67s
Muda wa majibu (upeo)	199.66s	172.60s
Muda wa majibu (jumla)	581.26s	673.41s

Onyesho la kizazi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium

Gharama: $0.041
Muda: 110.3s
Tokeni: 16,336 tok

#64 GLM 5.1

medium

SVG batili

Gharama: $0.000
Muda: 300.0s
Tokeni: 0 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Uandishi wa msimbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	10.0	10.0	100.0%	0		17.40s	12,909	232	9,556
GLM 5.1	9.5	10.0	100.0%	0		43.11s	17,298	327	4,206

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Akili ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Utatuzi wa mafumbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Maarifa ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho

Step 3.7 FlashhighvsGLM 5.1medium Gemini 3 Flash PreviewlowvsGrok 4.20medium Claude Sonnet 4.6nonevsGrok 4.20medium Qwen3.7 PlusnonevsGLM 5.1medium DeepSeek V4 PrononevsGLM 5.1medium Gemini 3.5 FlashnonevsGLM 5.1medium Claude Opus 4.8nonevsGrok 4.20medium Claude Opus 4.8nonevsGLM 5.1medium GPT-5.3 ChatnonevsGrok 4.20medium DeepSeek V4 PrononevsGrok 4.20medium Gemini 3 Flash PreviewnonevsGLM 5.1medium Qwen3.7 PlusnonevsGrok 4.20medium