MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5 Plus 2026-04-20

The average score is effectively tied at 7.2 vs 7.2. Qwen3.5 Plus 2026-04-20 (medium) has the lower benchmark cost at $0.317 vs $1.036. Qwen3.5 Plus 2026-04-20 (medium) is faster at 46.36s vs 109.98s, with pass rates of 63.6% vs 63.6%.

Recommended modelQwen3.5 Plus 2026-04-20 (medium)It has the best score here (7.2), while costing about 3.3x less than Kimi K2.6 (medium).

Last updated at: 2026-07-20

Metric	Kimi K2.6 Kimi K2.6 medium Release: 2026-04-20	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Release: 2026-04-20

Metric	Kimi K2.6 Kimi K2.6 medium Release: 2026-04-20	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Release: 2026-04-20
Score	7.2	7.2
Rank	#68	#70
Reliability	9.4	9.6
Consistency	8.3	9.0
Tests Correct
Attempt pass rate	63.6%	63.6%
Flaky tests	4	2
Total Runs	66	66
Cost per result	9.821	3.023
Total Cost	$1.036	$0.317
Input Price	$0.684 / 1M	$0.300 / 1M
Output Price	$3.420 / 1M	$1.800 / 1M
Total Input Tokens	68,902	42,097
Output Tokens	111,680	2,280
Reasoning Tokens	279,860	166,613
Response Time (avg)	109.98s	46.36s
Response Time (max)	876.20s	189.38s
Response Time (total)	2309.56s	973.57s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 MoonshotAI: Kimi K2.6

medium

Cost: $0.013
Time: 103.4s
Tokens: 3,620 tok

#70 Qwen3.5 Plus 2026-04-20

medium

Cost: $0.008
Time: 76.7s
Tokens: 4,355 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		10.84s	672	215	7,748

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Qwen3.5 Plus 2026-04-20	6.2	8.7	33.3%	0		125.25s	7,630	308	58,682

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Qwen3.5 Plus 2026-04-20	6.5	10.0	50.0%	0		92.41s	14,934	483	17,490

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		38.32s	7,782	270	14,668

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Qwen3.5 Plus 2026-04-20	2.9	7.2	11.1%	1		53.10s	771	63	28,414

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Qwen3.5 Plus 2026-04-20	4.9	9.6	0.0%	0		25.30s	516	125	4,792

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		20.25s	699	103	7,689

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Qwen3.5 Plus 2026-04-20	8.2	7.2	88.9%	1		17.67s	696	338	9,800

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		14.72s	8,193	348	2,164

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		92.57s	204	27	15,166

Quick Compare

Switch Comparison Pair

KAT-Coder-Pro V2.5highvsKimi K2.6medium Kimi K2.6mediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsKimi K2.6medium KAT-Coder-Pro V2.5highvsQwen3.5 Plus 2026-04-20medium Qwen3.5 Plus 2026-04-20mediumvsStep 3.7 Flashlow Kimi K2.6mediumvsQwen3.7 Plusnone Claude Opus 4.8nonevsQwen3.5 Plus 2026-04-20medium Claude Sonnet 4.6nonevsKimi K2.6medium KAT-Coder-Pro V2.5lowvsKimi K2.6medium Gemini 3 Flash PreviewlowvsKimi K2.6medium Claude Sonnet 4.6nonevsQwen3.5 Plus 2026-04-20medium KAT-Coder-Pro V2.5lowvsQwen3.5 Plus 2026-04-20medium