Z.ai: GLM 5 vs Z.ai: GLM 5

模型名称:

基准结果生成自 AI BENCHY 测试套件，时间： : 2026-02-27 15:16

摘要

反AI技巧	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	10.00	10.00	100.0%	0		420	4,992
Z.ai: GLM 5	4.00	10.00	33.3%	0		272	0

数据解析与提取	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	5.00	5.62	83.3%	1		567	3,734
Z.ai: GLM 5	10.00	10.00	100.0%	0		230	0

领域专项	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	1.00	4.41	33.3%	2		14,404	24,570
Z.ai: GLM 5	1.00	10.00	0.0%	0		20	0

指令遵循	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	9.50	9.99	100.0%	0		140	2,740
Z.ai: GLM 5	10.00	10.00	100.0%	0		62	0

Puzzle Solving	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	10.00	10.00	100.0%	0		159	5,527
Z.ai: GLM 5	6.67	9.99	66.7%	0		282	0

工具调用	分数	一致性	尝试通过率	不稳定测试	测试正确	输出令牌	推理令牌
Z.ai: GLM 5	10.00	10.00	100.0%	0		233	994
Z.ai: GLM 5	10.00	10.00	100.0%	0		220	0

将 Z.ai: GLM 5 与...对比