AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5-35B-A3B

Summary

Kimi K2.6 vs Qwen3.5-35B-A3B benchmark comparison: Qwen3.5-35B-A3B leads on average score with 6.3 vs 5.8. Kimi K2.6 has the lower benchmark cost at $0.079 vs $0.401. Kimi K2.6 is faster at 13.27s vs 72.57s, with pass rates of 36.5% vs 69.8%.

Recommended model: Kimi K2.6 - Its score stays close to the best score here (5.8 vs 6.3), while costing about 5.1x less than Qwen3.5-35B-A3B.

Last updated at: 2026-06-12

Metric	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24

Metric	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24
Score	5.8	6.3
Rank	#115	#88
Reliability	10.0	10.0
Consistency	9.2	7.5
Tests Correct
Attempt pass rate	36.5%	69.8%
Flaky tests	2	6
Total Runs	63	63
Cost per result	1.267	5.162
Total Cost	$0.079	$0.401
Input Price	$0.680 / 1M	$0.140 / 1M
Output Price	$3.410 / 1M	$1.000 / 1M
Total Input Tokens	32,916	42,196
Output Tokens	16,410	40,630
Reasoning Tokens	0	353,577
Response Time (avg)	13.27s	72.57s
Response Time (max)	238.89s	409.98s
Response Time (total)	278.57s	1524.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#115 MoonshotAI: Kimi K2.6

none

Cost: $0.020
Time: 127.4s
Tokens: 4,429 tok

#88 Qwen3.5-35B-A3B

medium

Cost: $0.009
Time: 71.4s
Tokens: 8,631 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053

Quick Compare

Switch Comparison Pair