AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs xAI: Grok 4.20

Muhtasari

Ulinganisho wa benchmark Kimi K2.6 vs Grok 4.20: Kimi K2.6 inaongoza kwa average score: 7.8 vs 7.3. Grok 4.20 ina gharama ya chini ya benchmark: $0.609 vs $0.889. Grok 4.20 ni ya haraka zaidi: 27.68s vs 71.67s, na pass rates 65.1% vs 63.5%.

Muundo unaopendekezwa: Grok 4.20 - Its score stays close to the best score here (7.3 vs 7.8), while responding about 2.6x faster than Kimi K2.6.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18

Kipimo	Kimi K2.6 Kimi K2.6 medium Toleo: 2026-04-20 Inapatikana bure	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31

Kipimo	Kimi K2.6 Kimi K2.6 medium Toleo: 2026-04-20 Inapatikana bure	Grok 4.20 Grok 4.20 medium Toleo: 2026-03-31
Alama	7.8	7.3
Nafasi	#35	#53
Uaminifu	10.0	10.0
Uthabiti	8.6	8.8
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio	65.1%	63.5%
Majaribio yasiyo thabiti	3	3
Jumla ya uendeshaji	63	63
Gharama kwa matokeo	8.358	8.309
Jumla ya gharama	$0.889	$0.609
Bei ya ingizo	$0.680 / 1M	$1.250 / 1M
Bei ya toleo	$3.410 / 1M	$2.500 / 1M
Jumla ya tokeni za ingizo	29,450	44,433
Tokeni za matokeo	102,923	1,819
Tokeni za hoja	254,094	219,524
Muda wa majibu (wastani)	71.67s	27.68s
Muda wa majibu (upeo)	406.78s	199.66s
Muda wa majibu (jumla)	1433.36s	581.26s

Onyesho la kizazi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 MoonshotAI: Kimi K2.6

medium

Gharama: $0.013
Muda: 103.4s
Tokeni: 3,620 tok

#53 xAI: Grok 4.20

medium

Gharama: $0.041
Muda: 110.3s
Tokeni: 16,336 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312

Uandishi wa msimbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	10.0	10.0	100.0%	0		40.96s	11,271	711	13,876
Grok 4.20	10.0	10.0	100.0%	0		17.40s	12,909	232	9,556

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339

Akili ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419

Utatuzi wa mafumbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620

Maarifa ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho

Gemini 3 Flash PreviewlowvsGrok 4.20medium Claude Sonnet 4.6nonevsGrok 4.20medium Kimi K2.6mediumInapatikana burevsStep 3.7 Flashlow Claude Opus 4.8nonevsGrok 4.20medium DeepSeek V4 ProhighvsKimi K2.6mediumInapatikana bure GPT-5.3 ChatnonevsGrok 4.20medium DeepSeek V4 PrononevsGrok 4.20medium Qwen3.7 PlusnonevsGrok 4.20medium Grok 4.20mediumvsGLM 5.2none Kimi K2.6mediumInapatikana burevsGPT-5.3 Chatnone Step 3.7 FlashhighvsGrok 4.20medium DeepSeek V4 ProhighvsGrok 4.20medium