AI BENCHY Compare

Cobuddy vs inclusionAI: Ling-2.6-1T

Summary

Cobuddy vs Ling-2.6-1T benchmark comparison: Cobuddy leads on average score with 4.9 vs 4.7. Cobuddy has the lower benchmark cost at $0.000 vs $0.005. Ling-2.6-1T is faster at 7.72s vs 39.90s, with pass rates of 47.6% vs 14.3%.

Recommended model: Ling-2.6-1T - Its score stays close to the best score here (4.7 vs 4.9), while responding about 5.2x faster than Cobuddy.

Last updated at: 2026-06-12

Metric	Cobuddy Cobuddy medium Release: 2026-05-06	Ling-2.6-1T Ling-2.6-1T none Release: 2026-04-23

Metric	Cobuddy Cobuddy medium Release: 2026-05-06	Ling-2.6-1T Ling-2.6-1T none Release: 2026-04-23
Score	4.9	4.7
Rank	#144	#152
Reliability	10.0	N/A
Consistency	7.5	10.0
Tests Correct
Attempt pass rate	47.6%	14.3%
Flaky tests	6	0
Total Runs	63	63
Cost per result	0.000	0.000
Total Cost	$0.000	$0.005
Input Price	$0.000 / 1M	$0.075 / 1M
Output Price	$0.000 / 1M	$0.625 / 1M
Total Input Tokens	37,449	34,905
Output Tokens	1,677	2,434
Reasoning Tokens	116,703	0
Response Time (avg)	39.90s	7.72s
Response Time (max)	309.02s	25.72s
Response Time (total)	797.98s	139.00s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	8.7	7.9	91.7%	1		10.00s	453	98	4,666
Ling-2.6-1T	3.4	10.0	0.0%	0		6.55s	726	777	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	3.7	6.7	22.2%	1		79.17s	4,726	358	30,138
Ling-2.6-1T	3.8	10.0	0.0%	0		10.57s	813	381	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		47.38s	18,324	465	7,265
Ling-2.6-1T	3.0	10.0	0.0%	0		23.53s	9,030	183	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	6.3	5.8	66.7%	1		17.36s	8,181	275	5,591
Ling-2.6-1T	10.0	10.0	100.0%	0		1.37s	8,313	285	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	2.9	4.4	22.2%	2		128.15s	540	10	49,454
Ling-2.6-1T	3.0	10.0	0.0%	0		1.04s	810	27	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	4.2	9.9	0.0%	0		23.23s	498	76	3,782
Ling-2.6-1T	5.0	10.0	0.0%	0		20.34s	540	140	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	9.8	10.0	100.0%	0		11.60s	508	64	2,842
Ling-2.6-1T	6.4	10.0	50.0%	0		5.36s	732	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	3.6	7.2	22.2%	1		12.83s	561	189	5,808
Ling-2.6-1T	3.1	10.0	0.0%	0		5.36s	729	131	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	10.0	10.0	100.0%	0		11.19s	3,505	133	294
Ling-2.6-1T	3.0	10.0	0.0%	0		25.72s	13,212	429	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		36.98s	153	9	6,863
Ling-2.6-1T	3.0	10.0	0.0%	0		0ms	0	0	0

Quick Compare

Switch Comparison Pair

Ling-2.6-1TnonevsMiniMax M2.5medium CobuddymediumvsGPT-4o-mininone Ling-2.6-1TnonevsQwen3 Coder Nextmedium CobuddymediumvsGLM 4.7 Flashnone CobuddymediumvsNemotron 3 SupernoneFree Available CobuddymediumvsLing-2.6-flashnone Trinity Large PreviewnonevsCobuddymedium CobuddymediumvsRing-2.6-1Tnone CobuddymediumvsGPT-5.4 Nanonone Cobuddymediumvsgpt-oss-120bnoneFree Available CobuddymediumvsQwen3.5-9Bnone CobuddymediumvsMiMo-V2.5none