← 返回信息流
创投信息钛媒体·5 天前

DeepSeek限制重生与修改次数 700亿融资亟待到位

原标题:700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

速览

DeepSeek近期限制用户重新生成和修改消息的次数,官方解释为应对激增用户量的临时限流措施,旨在保障基础对话服务。此举与ChatGPT、Claude等大厂在算力紧张时的降级策略一致,反映AI推理成本压力。官方暗示华为昇腾新卡部署后算力将大幅扩容,限制有望解除。

AI 深度解读

背景

2024年5月29日下午,国内知名人工智能公司 DeepSeek 的用户社区出现波动。大量用户反馈,DeepSeek 的网页端及 App 端对“重新生成”(Regenerate)和“修改消息”(Edit)功能实施了次数限制。具体表现为:在普通对话模式下,连续操作 3 至 6 次后页面会提示达到上限;而在专家模式(Expert Mode)下,机会可能仅剩 3 次。此外,修改输入内容的次数上限通常也被设定为 6 次。

这一变化并未伴随官方正式公告或公开的配额表,导致包括资深用户在内的社群产生焦虑情绪。尽管 DeepSeek 的 API 接口未受明显影响,但前端交互层面的突然限流引发了关于产品稳定性及未来收费策略的广泛讨论。与此同时,DeepSeek 近期还经历了专家模式文件上传功能下架、智能搜索功能关闭以及频繁出现的“服务器繁忙”提示,这些现象共同指向了底层算力资源的紧张状况。

核心内容

本次事件的核心在于 DeepSeek 因用户量激增导致的算力压力,从而采取的临时性服务降级措施。

1. 限制原因:算力瓶颈与资源优先级 据小红书上的“半官方账号”白墙透露,此次限制并非 DeepSeek 有意进行的“负优化”,而是应对突发高负载的临时手段。5月29日下午,App 端请求压力显著增加。为了保障最基础的文本对话功能正常运行,团队不得不优先保证核心体验,而对“重新生成”和“修改消息”这类高频消耗算力的操作进行限流。

2. 技术逻辑:推理成本与服务器压力 从技术角度看,“重新生成”和“修改消息”并非简单的界面刷新,而是需要模型重新处理上下文并生成新答案的完整推理请求。当大量用户将此类功能视为“无限抽卡”按钮并快速连续点击时,会产生巨大的服务器负载。相比之下,基础对话虽然也消耗资源,但频率相对可控;而反复重试和修改则呈指数级增加计算需求。

3. 行业通例:服务降级与配额管理 DeepSeek 并非孤例。在 AI 行业,当算力紧张或用户暴涨时,限流、降级、排队是常见做法:

  • ChatGPT:即使在付费用户中,高需求时期也可能遭遇使用次数限制;免费用户达到高级模型额度后,会被切换至更轻量的模型。
  • Claude (Anthropic):Anthropic 为不同用户设置使用预算,Claude Code 和 API 的使用上限随容量变化调整。Anthropic 曾在 5 月 6 日发文表示,随着新算力合作落地,提高了 Claude Code 和 API 的上限,反之则在压力增大时收紧限制。
  • 图像/视频生成工具:如 Sora、Gemini 等,在需求激增时均出现过生成次数收紧、排队时间延长或免费额度减少的情况。

4. 用户预期与产品透明度 此次争议的关键点不在于“是否限制”,而在于“如何限制”。用户已习惯 AI 产品的免费与便捷,一旦功能受限且缺乏事前说明,极易引发“产品缩水”或“即将收费”的猜测。相比之下,豆包此前因收费问题引发的舆论反弹,逻辑与此相通:用户对“基础能力免费、复杂能力收费”的接受度,取决于平台的透明度。

5. 未来展望 白墙建议用户在遇到限制时暂停操作,等待 15 至 30 分钟,避免被系统识别为异常高频请求。同时,华为昇腾超节点的新卡正在部署中,预计下半年上线,届时算力将大幅扩容,当前的临时限制大概率会取消。不过,DeepSeek 官方尚未就限制细节、恢复时间及后续扩容计划发布正式公告。

关键要点

  • 限制现象:DeepSeek 普通模式下重新生成/修改上限为 3-6 次,专家模式约 3 次,修改输入上限约 6 次。API 未受影响。
  • 根本原因:5月29日下午用户量激增,App 端请求压力过大,导致算力资源紧张。
  • 官方/半官方回应:小红书账号“白墙”称此为临时措施,非功能负优化。建议用户避免快速连续点击,等待 15-30 分钟可自动恢复。
  • 技术解释:“重新生成”和“修改”涉及完整的模型推理过程,重复操作会成倍增加服务器负载。
  • 行业背景:ChatGPT、Claude、Sora 等产品在算力紧张时均采取过类似限流、降级或额度调整策略。
  • 用户心理:争议焦点在于缺乏官方公告导致的信任危机。用户更在意限制是否透明、是否有提前告知,而非限制本身。
  • 未来预期:华为昇腾新卡预计下半年上线,算力扩容后限制有望解除。但官方尚未确认具体时间表。

意义与影响

1. 揭示 AI 基础设施的脆弱性与成本现实 DeepSeek 的限制措施再次印证了“每一次推理都有成本”的行业现实。随着大模型从技术尝鲜走向大众日常应用,底层算力基础设施的扩容速度往往滞后于用户增长。如何在有限资源下平衡用户体验与系统稳定性,成为所有 AI 公司面临的共同挑战。

2. 推动产品运营从“技术导向”向“用户沟通导向”转型 此次事件反映出,单纯的技术限流若缺乏透明的用户沟通,极易转化为品牌信任危机。当 AI 产品成为日常工具,用户对其稳定性和可预期性的要求显著提高。平台需要在实施限制前或同时,提供清晰的状态说明、恢复预期及受影响范围,以避免用户产生“被剥夺感”或“被收割”的负面联想。

3. 重塑用户对 AI 服务模式的认知 通过 ChatGPT、Claude 等先行者的实践,市场正在逐步接受“分级服务”和“动态配额”模式。基础对话可能保持免费或高额度,而高消耗功能(如多模态、长上下文、反复调试)则可能面临更严格的限制或逐步转向计量收费。DeepSeek 的此次调整,是这一行业演进趋势的又一次体现。

4. 加速算力供应链的多元化与国产化进程 DeepSeek 对华为昇腾新卡的依赖与期待,凸显了国产算力在支撑头部 AI 应用爆发式增长中的关键角色。下半年昇腾超节点新卡的上线,不仅关乎 DeepSeek 自身的服务恢复,也可能为其他受限于英伟达芯片供应的国内 AI 企业提供算力备份与扩容方案,进一步验证国产算力集群的可用性。

5. 对创业公司的警示:规模与体验的平衡艺术 对于 DeepSeek 而言,用户量的激增既是成功的标志,也是运营能力的试金石。如何在保持产品吸引力的同时,通过技术手段(如排队、异步处理)或产品策略(如功能分级)平滑处理流量高峰,将是其从“爆款产品”迈向“可持续平台”必须跨越的门槛。

查看原文 →tmtpost.com