AI BENCHY Compare

Inception: Mercury 2 vs xAI: Grok 4.20

Muhtasari

Ulinganisho wa benchmark Mercury 2 vs Grok 4.20: Mercury 2 inaongoza kwa average score: 4.6 vs 4.4. Mercury 2 ina gharama ya chini ya benchmark: $0.011 vs $0.057. Mercury 2 ni ya haraka zaidi: 653ms vs 1.11s, na pass rates 23.8% vs 28.6%.

Muundo unaopendekezwa: Mercury 2 - It has the best score here (4.6), while costing about 5.5x less than Grok 4.20.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18

Kipimo	Mercury 2 Mercury 2 none Toleo: 2026-02-24	Grok 4.20 Grok 4.20 none Toleo: 2026-03-31

Kipimo	Mercury 2 Mercury 2 none Toleo: 2026-02-24	Grok 4.20 Grok 4.20 none Toleo: 2026-03-31
Alama	4.6	4.4
Nafasi	#151	#155
Uaminifu	10.0	Haipo
Uthabiti	9.2	8.5
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio	23.8%	28.6%
Majaribio yasiyo thabiti	2	0
Jumla ya uendeshaji	63	54
Gharama kwa matokeo	0.259	1.570
Jumla ya gharama	$0.011	$0.057
Bei ya ingizo	$0.250 / 1M	$1.250 / 1M
Bei ya toleo	$0.750 / 1M	$2.500 / 1M
Jumla ya tokeni za ingizo	28,113	41,313
Tokeni za matokeo	4,439	1,923
Tokeni za hoja	0	0
Muda wa majibu (wastani)	653ms	1.11s
Muda wa majibu (upeo)	1.43s	6.04s
Muda wa majibu (jumla)	13.72s	19.96s

Onyesho la kizazi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none

Gharama: $0.002
Muda: 1.8s
Tokeni: 1,514 tok

#155 xAI: Grok 4.20

none

Gharama: $0.004
Muda: 6.5s
Tokeni: 1,367 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0
Grok 4.20	4.8	10.0	25.0%	0		501ms	1,986	267	0

Uandishi wa msimbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	3.4	9.6	0.0%	0		1.03s	7,229	3,088	0
Grok 4.20	1.1	3.1	0.0%	0		1.22s	1,074	312	0

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	3.0	10.0	0.0%	0		606ms	4,821	131	0
Grok 4.20	3.0	10.0	0.0%	0		6.04s	17,673	282	0

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0
Grok 4.20	10.0	10.0	100.0%	0		522ms	7,749	207	0

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0
Grok 4.20	3.0	10.0	0.0%	0		687ms	1,746	325	0

Akili ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0
Grok 4.20	4.8	10.0	0.0%	0		659ms	819	83	0

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0
Grok 4.20	6.3	10.0	50.0%	0		445ms	1,350	60	0

Utatuzi wa mafumbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0
Grok 4.20	5.3	10.0	33.3%	0		473ms	1,671	198	0

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0
Grok 4.20	10.0	10.0	100.0%	0		4.63s	7,245	189	0

Maarifa ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0
Grok 4.20	0.0	0.0	0.0%	0		0ms	0	0	0

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho

Mercury 2nonevsQwen3 Coder Nextmedium Grok 4.20nonevsGLM 4.7 Flashmedium Mercury 2nonevsMiniMax M2.5medium CobuddymediumvsMercury 2none Qwen3 Coder NextmediumvsGrok 4.20none Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsGrok 4.20none Mercury 2nonevsMistral Small 4medium Mercury 2nonevsMiniMax M2.7medium CobuddymediumvsGrok 4.20none Qwen3.5-9BmediumvsGrok 4.20none Mistral Small 4mediumvsGrok 4.20none