← 返回信息流
AI 资讯Hacker News·5 小时前

DeepSeek V4 推出峰谷定价策略

原标题:DeepSeek V4 Peak Valley Pricing Change

速览

DeepSeek 官方宣布为 V4 模型实施新的峰谷定价策略。该机制根据服务器负载情况动态调整价格,在低负载时段提供优惠。此举有助于平衡算力需求,提升资源利用率,同时为开发者提供更灵活的成本控制方案。

AI 深度解读

背景

近期,AI 大模型领域的竞争已从单纯的技术性能比拼,逐渐延伸至商业化落地与资源调度策略的优化。DeepSeek(深度求索)作为备受关注的中国 AI 初创公司,其即将发布的新一代模型 DeepSeek V4 备受业界瞩目。根据 ME News 援引 Beating 在 6 月 29 日(UTC+8)的监测报道,DeepSeek 官方正式确认了 DeepSeek V4 的发布计划,并同步公布了一项重大的 API 定价策略调整——引入“峰谷定价”机制。这一举措标志着 DeepSeek 在商业化运营上迈出了关键一步,旨在通过价格杠杆平衡算力负载,同时为即将到来的 V4 版本发布预热。

核心内容

DeepSeek 官方宣布,DeepSeek V4 计划于 7 月中旬正式对外发布。与此同时,其 API 服务将正式启用峰谷定价机制(Peak-Valley Pricing)。该机制根据一天中的不同时段,对 API 调用费用进行差异化计费,以应对高峰期的算力需求压力。

1. 峰谷时段划分

  • 高峰时段(Peak Hours): 每日北京时间 09:00 - 12:00 以及 14:00 - 18:00。
  • 平峰/低谷时段: 除上述高峰时段外的其他时间。

2. 具体定价策略 在高峰时段,API 的基础费率将调整为常规费率的 2 倍。具体模型及价格细节如下:

  • 高性能模型:deepseek-v4-pro

    • 常规费率(每百万 Token):
      • 输入缓存命中(Cache Hit):¥0.025
      • 输入缓存未命中(Cache Miss):¥3.00
      • 输出(Output):¥6.00
    • 高峰时段费率(每百万 Token):
      • 输入缓存命中:¥0.05
      • 输入缓存未命中:¥6.00
      • 输出:¥12.00
  • 轻量级模型:deepseek-v4-flash

    • 常规费率(每百万 Token):
      • 输入缓存命中:¥0.02
      • 输入缓存未命中:¥1.00
      • 输出:¥2.00
    • 高峰时段费率(每百万 Token):
      • 输入缓存命中:¥0.04
      • 输入缓存未命中:¥2.00
      • 输出:¥4.00

3. 通知机制 为确保用户知情权,DeepSeek 承诺在实际执行任何价格变动前,会通过电子邮件提前 24 小时 通知用户。

关键要点

  • 发布与定价同步: DeepSeek V4 的发布(7 月中旬)与新的峰谷定价策略是同步推出的,这不仅是产品迭代,也是运营策略的重大调整。
  • 明确的时段界定: 高峰时段严格限定为工作日的上午(9-12点)和下午(14-18点),这与中国大多数企业和开发者的活跃工作时间高度重合。
  • 价格翻倍效应: 在高峰时段,无论是输入还是输出,所有计费项的价格均上涨至常规价格的 200%。
  • 缓存机制影响显著: 定价明确区分了“缓存命中”与“缓存未命中”。对于 deepseek-v4-pro,缓存命中的价格极低(¥0.025/¥0.05),而未命中则大幅上涨(¥3.00/¥6.00),这鼓励用户优化 Prompt 结构或复用上下文,以降低成本。
  • 双模型策略: 提供高性能版(Pro)和轻量级版(Flash)两种选择,满足不同场景对速度和成本的需求,且两者均适用相同的峰谷定价逻辑。
  • 透明沟通: 24 小时的前置邮件通知机制,体现了平台对 B 端用户商业连续性的尊重。

意义与影响

1. 算力资源的精细化运营 引入峰谷定价是云计算和 AI 服务领域常见的资源管理手段。通过在经济上引导用户错峰使用,DeepSeek 可以有效缓解 9:00-18:00 这一核心工作时段的服务拥堵,提升整体系统的稳定性和响应速度。这对于保障高并发场景下的服务质量至关重要。

2. 降低用户长期成本的可能性 虽然高峰时段价格翻倍,但对于非实时性要求高、或拥有自动化批处理任务的用户而言,将任务安排在夜间或非高峰时段运行,可以节省高达 50% 的 API 调用成本。这将促使开发者重新审视其应用架构,优化任务调度逻辑。

3. 对缓存优化的激励 DeepSeek 对“缓存命中”给予极低的价格优惠,而对“缓存未命中”收取高额费用,这明确传递了一个信号:平台鼓励用户通过优化 Prompt 工程、复用历史对话上下文等方式来提高缓存命中率。这不仅有助于降低用户的实际支出,也有助于平台内部计算资源的更高效利用。

4. 行业竞争格局的演变 随着 DeepSeek V4 的发布,其性能表现将直接接受市场检验。而配合这种灵活的定价策略,DeepSeek 试图在保持技术竞争力的同时,构建更具弹性的商业生态。这种“技术+运营”双轮驱动的模式,可能会成为国内大模型厂商商业化落地的参考范本。

5. 用户适应期与合规性 24 小时的通知机制虽然提供了缓冲期,但对于依赖实时 API 调用的应用开发者而言,仍需密切关注官方公告,及时调整代码中的重试逻辑或预算设置,以避免因突发价格波动导致的意外成本超支。

查看原文 →kucoin.com