AI BENCHY 对比

Cobuddy vs inclusionAI: Ling-2.6-1T

摘要

Cobuddy vs Ling-2.6-1T benchmark 对比：Cobuddy 平均分领先，为 4.9 vs 4.7。 Cobuddy benchmark 成本更低，为 $0.000 vs $0.005。 Ling-2.6-1T 更快，为 7.72s vs 39.90s，通过率为 47.6% vs 14.3%。

推荐模型: Ling-2.6-1T - 它的得分接近这里的最高分（4.7 vs 4.9），同时响应速度比Cobuddy快约 5.2 倍。

基准结果生成自 AI BENCHY 测试套件，时间：: 2026-06-12

指标	Cobuddy Cobuddy medium 发布日期: 2026-05-06	Ling-2.6-1T Ling-2.6-1T none 发布日期: 2026-04-23

指标	Cobuddy Cobuddy medium 发布日期: 2026-05-06	Ling-2.6-1T Ling-2.6-1T none 发布日期: 2026-04-23
分数	4.9	4.7
排名	#144	#152
可靠性	10.0	不适用
一致性	7.5	10.0
测试正确
尝试通过率	47.6%	14.3%
不稳定测试	6	0
总运行次数	63	63
每个结果成本	0.000	0.000
总成本	$0.000	$0.005
输入价格	$0.000 / 1M	$0.075 / 1M
输出价格	$0.000 / 1M	$0.625 / 1M
总输入令牌	37,449	34,905
输出令牌	1,677	2,434
推理令牌	116,703	0
响应时间（平均）	39.90s	7.72s
响应时间（最大）	309.02s	25.72s
响应时间（总计）	797.98s	139.00s

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

类别细分

反AI技巧	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	8.7	7.9	91.7%	1		10.00s	453	98	4,666
Ling-2.6-1T	3.4	10.0	0.0%	0		6.55s	726	777	0

编程	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	3.7	6.7	22.2%	1		79.17s	4,726	358	30,138
Ling-2.6-1T	3.8	10.0	0.0%	0		10.57s	813	381	0

综合	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	3.0	10.0	0.0%	0		47.38s	18,324	465	7,265
Ling-2.6-1T	3.0	10.0	0.0%	0		23.53s	9,030	183	0

数据解析与提取	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	6.3	5.8	66.7%	1		17.36s	8,181	275	5,591
Ling-2.6-1T	10.0	10.0	100.0%	0		1.37s	8,313	285	0

领域专项	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	2.9	4.4	22.2%	2		128.15s	540	10	49,454
Ling-2.6-1T	3.0	10.0	0.0%	0		1.04s	810	27	0

通用智能	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	4.2	9.9	0.0%	0		23.23s	498	76	3,782
Ling-2.6-1T	5.0	10.0	0.0%	0		20.34s	540	140	0

指令遵循	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	9.8	10.0	100.0%	0		11.60s	508	64	2,842
Ling-2.6-1T	6.4	10.0	50.0%	0		5.36s	732	81	0

谜题求解	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	3.6	7.2	22.2%	1		12.83s	561	189	5,808
Ling-2.6-1T	3.1	10.0	0.0%	0		5.36s	729	131	0

工具调用	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	10.0	10.0	100.0%	0		11.19s	3,505	133	294
Ling-2.6-1T	3.0	10.0	0.0%	0		25.72s	13,212	429	0

常识问答	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Cobuddy	3.0	10.0	0.0%	0		36.98s	153	9	6,863
Ling-2.6-1T	3.0	10.0	0.0%	0		0ms	0	0	0

快速对比

切换对比组合

Ling-2.6-1TnonevsMiniMax M2.5medium CobuddymediumvsGPT-4o-mininone Ling-2.6-1TnonevsQwen3 Coder Nextmedium CobuddymediumvsGLM 4.7 Flashnone CobuddymediumvsNemotron 3 Supernone免费可用 CobuddymediumvsLing-2.6-flashnone Trinity Large PreviewnonevsCobuddymedium CobuddymediumvsRing-2.6-1Tnone CobuddymediumvsGPT-5.4 Nanonone Cobuddymediumvsgpt-oss-120bnone免费可用 CobuddymediumvsQwen3.5-9Bnone CobuddymediumvsMiMo-V2.5none