Anthropic: Claude Fable 5 vs Anthropic: Claude Opus 4.8

Claude Opus 4.8 (medium) 平均分领先，为 8.8 vs 8.6。 Claude Opus 4.8 (medium) benchmark 成本更低，为 $1.931 vs $3.478。 Claude Opus 4.8 (medium) 更快，为 12.49s vs 17.20s，通过率为 78.8% vs 84.9%。

推荐模型Claude Opus 4.8 (medium)它在这里得分最高（8.8），同时成本比Claude Fable 5 (medium)低约 1.8 倍。

基准结果生成自 AI BENCHY 测试套件，时间：: 2026-07-25

指标	Claude Fable 5 Claude Fable 5 medium 发布日期: 2026-06-10	Claude Opus 4.8 Claude Opus 4.8 medium 发布日期: 2026-05-28

指标	Claude Fable 5 Claude Fable 5 medium 发布日期: 2026-06-10	Claude Opus 4.8 Claude Opus 4.8 medium 发布日期: 2026-05-28
分数	8.6	8.8
排名	#22	#19
可靠性	10.0	10.0
一致性	9.6	9.6
测试正确
尝试通过率	78.8%	84.9%
不稳定测试	1	1
总运行次数	66	66
每个结果成本	20.459	10.724
总成本	$3.478	$1.931
输入价格	$10.000 / 1M	$5.000 / 1M
输出价格	$50.000 / 1M	$25.000 / 1M
总输入令牌	89,643	138,451
输出令牌	41,360	40,766
推理令牌	10,269	9,075
响应时间（平均）	17.20s	12.49s
响应时间（最大）	80.80s	70.54s
响应时间（总计）	378.41s	274.72s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Claude Fable 5

medium

成本: $0.606
时间: 156.7s
令牌: 12,264 tok

#19 Claude Opus 4.8

medium

成本: $0.057
时间: 23.1s
令牌: 2,412 tok

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

类别细分

类别:

反AI技巧	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		6.20s	834	530	402
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	834	1,179	478

编程	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		15.59s	10,590	7,383	1,318
Claude Opus 4.8	10.0	10.0	100.0%	0		15.33s	10,590	9,945	1,381

综合	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	6.5	10.0	50.0%	0		27.47s	52,197	2,373	1,599
Claude Opus 4.8	9.9	10.0	100.0%	0		54.29s	101,005	19,531	4,762

数据解析与提取	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		7.18s	10,503	521	363
Claude Opus 4.8	7.1	5.6	83.3%	1		12.29s	10,503	481	312

领域专项	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	5.3	7.2	44.4%	1		53.40s	975	25,215	5,001
Claude Opus 4.8	5.3	10.0	33.3%	0		14.59s	975	7,477	900

通用智能	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		7.42s	708	366	144
Claude Opus 4.8	10.0	10.0	100.0%	0		2.46s	708	237	0

指令遵循	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		5.90s	909	139	202
Claude Opus 4.8	10.0	10.0	100.0%	0		3.32s	909	373	320

谜题求解	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	7.7	10.0	66.7%	0		5.18s	894	402	324
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	894	791	483

工具调用	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	10.0	10.0	100.0%	0		16.96s	11,775	729	344
Claude Opus 4.8	10.0	10.0	100.0%	0		8.96s	11,775	301	225

常识问答	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
Claude Fable 5	3.0	10.0	0.0%	0		25.64s	258	3,702	572
Claude Opus 4.8	3.0	10.0	0.0%	0		6.14s	258	451	214

快速对比

切换对比组合

Claude Opus 4.8mediumvsGrok 4.5high Claude Opus 4.8mediumvsGemini 3.5 Flashlow Claude Fable 5mediumvsGrok 4.5low Claude Fable 5mediumvsGrok 4.5high Claude Fable 5mediumvsGemini 3.5 Flashlow Claude Fable 5mediumvsMuse Spark 1.1low Claude Opus 4.8mediumvsGrok 4.5low Claude Opus 4.8mediumvsGPT-5.5low Claude Opus 4.8mediumvsGPT-5.6 Solhigh Claude Opus 4.8mediumvsGemini 3.6 Flashlow Claude Fable 5mediumvsMuse Spark 1.1high Claude Fable 5mediumvsGemini 3.5 Flash-Litehigh