Kimi K2.6 (medium) vs Grok 4.3 (medium)

Recommended model Grok 4.3 (medium)

Its score stays close to the best score here (7.1 vs 7.2), while responding about 2.3x faster than Kimi K2.6 (medium).

Detailed comparison

Metric	Kimi K2.6 Kimi K2.6 medium Release: 2026-04-20	Grok 4.3 Grok 4.3 medium Release: 2026-05-01

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Grok 4.3	6.5	10.0	50.0%	0		55.07s	108,468	11,992	21,601

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Switch Comparison Pair