← 返回信息流
Agent SkillLINUX DO · AI·2 小时前

Claude Sonnet 模型成本测试:无优势拉完

原标题:Claude模型使用成本计算,Sonnet拉完了

速览

Anthropic 的 Claude 系列模型在实际应用中被开发者广泛关注。作者通过对比 Opus 与 Sonnet 5/4.6 在相同子代理任务下的成本、耗时和效率,发现 Sonnet 单价虽低但轮次更多,缓存读抵消优势;折扣期结束后成本与 Opus 一致。Opus 在高确定性 PRD+spec 任务中效率最高,结论是大部分情况下无需切换 Sonnet,Claude 模型成本优化仍需谨慎

AI 深度解读

Claude子代理成本测试:Sonnet拉完了?Opus效率更高,Sonnet5折扣期优势终结

背景

在AI子代理(multi-agent)工作中,开发者常通过多个模型协作完成复杂任务。Anthropic的Claude系列模型因其强大推理能力,广泛用于执行子代理。用户分享者执行子代理项目已使用Sonnet数日,体感成本较高,便决定对Opus 4.8、Sonnet 5及Sonnet 4.6进行同等真实任务对比测试。测试条件为高努力等级(effort: high),且确定性PRD+spec约束下任务质量相近。测试目的在于量化各模型的单价、总成本、耗时及工具调用次数,考察子代理场景下的性价比。

核心内容

执行者基于相同真实任务,分别调用Opus 4.8、Sonnet 5(现行intro价,至2026-08-31)和Sonnet 4.6三个模型,记录详细指标。PRD文档与spec约束已提供,质量均相近。单价单位为美元/百万tokens($/MTok),拆分为input、cache write、cache read、output四项(in/cache write/cache read/out)。Sonnet 5现行intro价为2/2.5/0.2/10,标准价为3/3.75/0.3/15;Sonnet 4.6标准价为3/3.75/0.3/15。

计算结果汇总如下表格:

| 轨 | 模型 | API calls | input | cache write | cache read | output | USD 现行价 | USD 标准价 | 耗时 | 工具调用 | |------|----------|-----------|-----------|-------------|-----------------|-----------|------------|------------|--------|----------| | B-op | Opus 4.8 | 105 | 16,494 | 356,428 | 6,327,208 | 20,431 | $5.99 | $5.99 | 421s | 59 | | B-s5 | Sonnet 5 | 153 | 21,325 | 361,151 | 12,459,293 | 28,243 | $3.72 | $5.58 | 524s | 96 | | B-s46| Sonnet 4.6| 160 | 698 | 793,623 | 7,847,718 | 33,131 | $5.83 | $5.83 | 774s | 97 | | F-op | Opus 4.8 | 77 | 8,300 | 178,097 | 3,845,863 | 13,977 | $3.43 | $3.43 | 410s | 42 | | F-s5 | Sonnet 5 | 91 | 23,849 | 278,204 | 7,061,095 | 14,625 | $2.30 | $3.45 | 505s | 58 | | F-s46| Sonnet 4.6| 83 | 91 | 422,740 | 3,784,542 | 14,880 | $2.94 | $2.94 | 489s | 51 |

执行者进一步分析:

  • 在有详细PRD文档和spec约束的前提下,实现质量都差不多。
  • Sonnet 5单价虽更低,但轮次比Opus多约50%,单价优势被更多轮次的缓存读抵消,成本纯靠折扣期降;一旦折扣期结束,成本就与Opus一致。
  • Sonnet 4.6也不便宜,且最慢。
  • Opus效率最高。

总结:Sonnet现在成本、效率都没什么优势,大部分任务都不如直接用Opus做子代理。

关键要点

  • Sonnet 5现行intro价(2026-08-31前)输入2、缓存写2.5、缓存读0.2、输出10;标准价输入3、缓存写3.75、缓存读0.3、输出15。
  • Sonnet 4.6与Sonnet 5标准价相同(输入3、缓存写3.75、缓存读0.3、输出15)。
  • Opus 4.8单价输入5、缓存写6.25、缓存读0.5、输出25。
  • B-op(Opus)现行价$5.99,耗时421秒,工具调用59次;F-op(Opus)现行价$3.43,耗时410秒,工具调用42次。
  • Sonnet 5在现行价下总成本$3.72(B轨),低于Opus,但折扣期结束后$5.58(与Opus相当);更多轮次与更高缓存读消耗抵消单价优势。
  • Sonnet 4.6现行价$5.83(B轨),耗时774秒(最慢),工具调用97次。
  • 任务质量近似,Opus效率最高,Sonnet在子代理场景无成本与效率优势。

意义与影响

此测试为Claude子代理开发者提供了真实数据支持:折扣期Sonnet 5成本优势显著,但若任务轮次多、缓存读消耗大,Opus效率胜出;折扣后Sonnet 5与Opus成本持平,Sonnet 4.6则因速度慢不具优势。结论建议大部分子代理任务直接切换Opus,避免Sonnet的轮次与缓存开销劣势。开发者可据此调整子代理架构、优化缓存策略或任务拆分,提升整体性价比与运行效率。

查看原文 →linux.do