Agent SkillLINUX DO · AI·2 小时前

Claude Sonnet 模型成本测试：无优势拉完

原标题：Claude模型使用成本计算，Sonnet拉完了

速览

Anthropic 的 Claude 系列模型在实际应用中被开发者广泛关注。作者通过对比 Opus 与 Sonnet 5/4.6 在相同子代理任务下的成本、耗时和效率，发现 Sonnet 单价虽低但轮次更多，缓存读抵消优势；折扣期结束后成本与 Opus 一致。Opus 在高确定性 PRD+spec 任务中效率最高，结论是大部分情况下无需切换 Sonnet，Claude 模型成本优化仍需谨慎

AI 深度解读

Claude子代理成本测试：Sonnet拉完了？Opus效率更高，Sonnet5折扣期优势终结

背景

在AI子代理（multi-agent）工作中，开发者常通过多个模型协作完成复杂任务。Anthropic的Claude系列模型因其强大推理能力，广泛用于执行子代理。用户分享者执行子代理项目已使用Sonnet数日，体感成本较高，便决定对Opus 4.8、Sonnet 5及Sonnet 4.6进行同等真实任务对比测试。测试条件为高努力等级（effort: high），且确定性PRD+spec约束下任务质量相近。测试目的在于量化各模型的单价、总成本、耗时及工具调用次数，考察子代理场景下的性价比。

核心内容

执行者基于相同真实任务，分别调用Opus 4.8、Sonnet 5（现行intro价，至2026-08-31）和Sonnet 4.6三个模型，记录详细指标。PRD文档与spec约束已提供，质量均相近。单价单位为美元/百万tokens（$/MTok），拆分为input、cache write、cache read、output四项（in/cache write/cache read/out）。Sonnet 5现行intro价为2/2.5/0.2/10，标准价为3/3.75/0.3/15；Sonnet 4.6标准价为3/3.75/0.3/15。

计算结果汇总如下表格：

| 轨 | 模型 | API calls | input | cache write | cache read | output | USD 现行价 | USD 标准价 | 耗时 | 工具调用 | |------|----------|-----------|-----------|-------------|-----------------|-----------|------------|------------|--------|----------| | B-op | Opus 4.8 | 105 | 16,494 | 356,428 | 6,327,208 | 20,431 | $5.99 | $5.99 | 421s | 59 | | B-s5 | Sonnet 5 | 153 | 21,325 | 361,151 | 12,459,293 | 28,243 | $3.72 | $5.58 | 524s | 96 | | B-s46| Sonnet 4.6| 160 | 698 | 793,623 | 7,847,718 | 33,131 | $5.83 | $5.83 | 774s | 97 | | F-op | Opus 4.8 | 77 | 8,300 | 178,097 | 3,845,863 | 13,977 | $3.43 | $3.43 | 410s | 42 | | F-s5 | Sonnet 5 | 91 | 23,849 | 278,204 | 7,061,095 | 14,625 | $2.30 | $3.45 | 505s | 58 | | F-s46| Sonnet 4.6| 83 | 91 | 422,740 | 3,784,542 | 14,880 | $2.94 | $2.94 | 489s | 51 |

执行者进一步分析：

在有详细PRD文档和spec约束的前提下，实现质量都差不多。
Sonnet 5单价虽更低，但轮次比Opus多约50%，单价优势被更多轮次的缓存读抵消，成本纯靠折扣期降；一旦折扣期结束，成本就与Opus一致。
Sonnet 4.6也不便宜，且最慢。
Opus效率最高。

总结：Sonnet现在成本、效率都没什么优势，大部分任务都不如直接用Opus做子代理。

关键要点

Sonnet 5现行intro价（2026-08-31前）输入2、缓存写2.5、缓存读0.2、输出10；标准价输入3、缓存写3.75、缓存读0.3、输出15。
Sonnet 4.6与Sonnet 5标准价相同（输入3、缓存写3.75、缓存读0.3、输出15）。
Opus 4.8单价输入5、缓存写6.25、缓存读0.5、输出25。
B-op（Opus）现行价$5.99，耗时421秒，工具调用59次；F-op（Opus）现行价$3.43，耗时410秒，工具调用42次。
Sonnet 5在现行价下总成本$3.72（B轨），低于Opus，但折扣期结束后$5.58（与Opus相当）；更多轮次与更高缓存读消耗抵消单价优势。
Sonnet 4.6现行价$5.83（B轨），耗时774秒（最慢），工具调用97次。
任务质量近似，Opus效率最高，Sonnet在子代理场景无成本与效率优势。

意义与影响

此测试为Claude子代理开发者提供了真实数据支持：折扣期Sonnet 5成本优势显著，但若任务轮次多、缓存读消耗大，Opus效率胜出；折扣后Sonnet 5与Opus成本持平，Sonnet 4.6则因速度慢不具优势。结论建议大部分子代理任务直接切换Opus，避免Sonnet的轮次与缓存开销劣势。开发者可据此调整子代理架构、优化缓存策略或任务拆分，提升整体性价比与运行效率。

查看原文 →linux.do

Claude Sonnet 模型成本测试：无优势拉完

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐