Kimi K2.6 (medium) vs Kimi K2.7 Code (medium)

Recommended model Kimi K2.7 Code (medium)

It has the strongest score in this comparison (7.5) and the best overall balance of cost and response time across all 2 models.

Detailed comparison

Metric	Kimi K2.6 Kimi K2.6 medium Release: 2026-04-20	Kimi K2.7 Code Kimi K2.7 Code medium Release: 2026-06-12

Metric	Kimi K2.6 Kimi K2.6 medium Release: 2026-04-20	Kimi K2.7 Code Kimi K2.7 Code medium Release: 2026-06-12
Score	7.2	7.5
Rank	#78	#61
Reliability	9.4	10.0
Consistency	8.3	8.3
Tests Correct
Attempt pass rate	63.6%	65.2%
Flaky tests	4	4
Total Runs	66	66
Cost per result	9.821	6.457
Total Cost	$0.831	$0.688
Input Price	$0.646 / 1M	$0.730 / 1M
Output Price	$2.720 / 1M	$3.500 / 1M
Total Input Tokens	68,902	72,073
Output Tokens	111,680	83,714
Reasoning Tokens	279,860	178,793
Response Time (avg)	109.98s	84.25s
Response Time (max)	876.20s	365.80s
Response Time (total)	2309.56s	1769.22s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Kimi K2.7 Code	7.8	9.3	66.7%	0		146.73s	4,650	1,864	25,635

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Kimi K2.7 Code	7.3	5.8	83.3%	1		66.03s	57,353	3,642	21,308

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Kimi K2.7 Code	5.5	9.3	33.3%	0		213.29s	431	55,572	63,639

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

Switch Comparison Pair