AI BENCHY Compare

xAI: Grok 4.20 vs xAI: Grok 4.3

Muhtasari

Ulinganisho wa benchmark Grok 4.20 vs Grok 4.3: Grok 4.3 inaongoza kwa average score: 7.7 vs 7.3. Grok 4.20 ina gharama ya chini ya benchmark: $0.609 vs $0.614. Grok 4.20 ni ya haraka zaidi: 27.68s vs 47.51s, na pass rates 63.5% vs 71.4%.

Muundo unaopendekezwa: Grok 4.20 - Its score stays close to the best score here (7.3 vs 7.7), while responding about 1.7x faster than Grok 4.3.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18

Kipimo	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31	Grok 4.3 Grok 4.3 medium Toleo: 2026-05-01

Kipimo	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31	Grok 4.3 Grok 4.3 medium Toleo: 2026-05-01
Alama	7.3	7.7
Nafasi	#53	#37
Uaminifu	10.0	10.0
Uthabiti	8.8	8.5
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio	63.5%	71.4%
Majaribio yasiyo thabiti	3	4
Jumla ya uendeshaji	63	63
Gharama kwa matokeo	8.309	4.724
Jumla ya gharama	$0.609	$0.614
Bei ya ingizo	$1.250 / 1M	$1.250 / 1M
Bei ya toleo	$2.500 / 1M	$2.500 / 1M
Jumla ya tokeni za ingizo	44,433	44,472
Tokeni za matokeo	1,819	1,981
Tokeni za hoja	219,524	221,382
Muda wa majibu (wastani)	27.68s	47.51s
Muda wa majibu (upeo)	199.66s	216.69s
Muda wa majibu (jumla)	581.26s	997.68s

Onyesho la kizazi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium

Gharama: $0.041
Muda: 110.3s
Tokeni: 16,336 tok

#37 xAI: Grok 4.3

medium

Gharama: $0.009
Muda: 19.0s
Tokeni: 3,661 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Uandishi wa msimbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	10.0	10.0	100.0%	0		17.40s	12,909	232	9,556
Grok 4.3	10.0	10.0	100.0%	0		63.99s	12,909	234	15,301

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Akili ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Utatuzi wa mafumbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Maarifa ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho

Step 3.7 FlashlowvsGrok 4.3medium Gemini 3 Flash PreviewlowvsGrok 4.20medium Claude Sonnet 4.6nonevsGrok 4.20medium DeepSeek V4 ProhighvsGrok 4.3medium Claude Opus 4.8nonevsGrok 4.20medium GPT-5.3 ChatnonevsGrok 4.20medium DeepSeek V4 PrononevsGrok 4.20medium Qwen3.7 PlusnonevsGrok 4.20medium GPT-5.3 ChatnonevsGrok 4.3medium Grok 4.20mediumvsGLM 5.2none Step 3.7 FlashhighvsGrok 4.20medium DeepSeek V4 ProhighvsGrok 4.20medium