AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs xAI: Grok 4.20

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-20

Metriek	Kimi K2.6 Kimi K2.6 none Releasedatum: 2026-04-20	Grok 4.20 Grok 4.20 medium Releasedatum: 2026-03-31

Metriek	Kimi K2.6 Kimi K2.6 none Releasedatum: 2026-04-20	Grok 4.20 Grok 4.20 medium Releasedatum: 2026-03-31
Score	5.8	7.0
Rang	#69	#47
Consistentie	9.1	7.8
Correcte tests
Slaagpercentage per poging	42.6%	66.7%
Instabiele tests	2	5
Totaal runs	54	54
Kosten per resultaat	0.543	8.252
Totale kosten	$0.038	$0.743
Invoerprijs	$0.950 / 1M	$2.000 / 1M
Uitvoerprijs	$4.000 / 1M	$6.000 / 1M
Uitvoer-tokens	2,973	1,744
Redeneer-tokens	0	109,882
Responstijd (gem.)	2.05s	10.33s
Responstijd (max)	6.65s	29.87s
Responstijd (totaal)	36.93s	185.87s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	471	0
Grok 4.20	8.2	7.9	83.3%	1		3.36s	280	8,476

Programmeren	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	10.0	10.0	100.0%	0		6.65s	1,176	0
Grok 4.20	4.3	1.1	66.7%	1		24.33s	250	12,804

Gecombineerd	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	290	0
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556

Gegevensparsering en extractie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	201	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333

Domeinspecifiek	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	42	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339

Algemene intelligentie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	138	0
Grok 4.20	5.8	2.8	66.7%	1		7.09s	47	4,252

Instructies opvolgen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	72	0
Grok 4.20	7.3	5.9	83.3%	1		4.42s	40	5,474

Puzzeloplossing	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	3.4	9.7	0.0%	0		1.66s	343	0
Grok 4.20	6.4	7.7	55.6%	1		3.89s	143	8,028

Toolaanroepen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	240	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620

Snelle vergelijking

Vergelijkingspaar wisselen

Kimi K2.6nonevsgpt-oss-120bmediumGratis beschikbaar Gemma 4 31BnoneGratis beschikbaarvsGrok 4.20medium MiniMax M2.5mediumGratis beschikbaarvsKimi K2.6none Mistral Small 4mediumvsKimi K2.6none Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Grok 4.20mediumvsGLM 5none Kimi K2.6nonevsGPT-5 Nanomedium Claude Sonnet 4.6nonevsGrok 4.20medium Grok 4.20mediumvsMiMo-V2-Omninone MiniMax M2.7mediumvsKimi K2.6none Kimi K2.6nonevsElephantmedium Mercury 2mediumvsKimi K2.6none