AI BENCHY Compare

Cobuddy vs MoonshotAI: Kimi K2.6

Last updated at: 2026-05-06

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20
Score	6.0	5.8
Rank	#90	#94
Reliability	9.9	N/A
Consistency	6.7	9.1
Tests Correct
Attempt pass rate	57.4%	42.6%
Flaky tests	7	2
Total Runs	54	54
Cost per result	0.000	0.543
Total Cost	$0.000	$0.038
Input Price	$0.000 / 1M	$0.750 / 1M
Output Price	$0.000 / 1M	$3.500 / 1M
Output Tokens	1,639	2,973
Reasoning Tokens	89,199	0
Response Time (avg)	36.47s	2.05s
Response Time (max)	309.02s	6.65s
Response Time (total)	656.47s	36.93s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	471	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.3	1.1	66.7%	1		53.59s	343	9,678
Kimi K2.6	10.0	10.0	100.0%	0		6.65s	1,176	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	290	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	201	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	42	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	138	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	72	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Kimi K2.6	3.2	9.8	0.0%	0		1.66s	343	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	240	0

Quick Compare

Switch Comparison Pair

Kimi K2.6nonevsgpt-oss-120bmediumFree Available CobuddymediumFree AvailablevsOwl Alphanone CobuddymediumFree AvailablevsMiMo-V2-Pronone CobuddymediumFree AvailablevsGLM 4.7 Flashnone CobuddymediumFree AvailablevsQwen3.5-27Bnone CobuddymediumFree AvailablevsGPT-5.4none CobuddymediumFree AvailablevsQwen3.6 27Bnone CobuddymediumFree AvailablevsQwen3.5-35B-A3Bnone CobuddymediumFree AvailablevsGLM 5.1none CobuddymediumFree AvailablevsQwen3.5 Plus 2026-04-20none CobuddymediumFree AvailablevsDeepSeek V3.2none CobuddymediumFree AvailablevsMiMo-V2.5-Pronone