AI 资讯量子位·2 小时前

DeepSeek不储备弹药难以为继，Claude Mythos或促梁文锋融资

原标题：Claude Mythos让梁文锋决定融资

速览

DeepSeek在激烈的AI竞争中面临资金消耗过大的挑战，若不储备充足弹药将难以持续运营。在此背景下，Claude Mythos等新技术的出现加剧了行业竞争态势。这一局势可能促使DeepSeek创始人梁文锋加速融资决策，以确保持续的研发投入和市场竞争力。

AI 深度解读

背景

近期，AI 领域的竞争格局因 Anthropic 发布的 Claude Mythos 模型而发生重大变化。据 The Information 报道，DeepSeek 创始人梁文锋在目睹 Claude Mythos 通过海量算力和数据展现出超强能力后，意识到 DeepSeek 若不储备充足的“弹药”（资金与算力资源），将无法在激烈的技术竞赛中维持生存与发展。这一认知直接促成了 DeepSeek 启动大规模融资计划。

时间线上，Anthropic 于今年 4 月发布了 Claude 的预览版，而 DeepSeek 的融资传闻也在同年 4 月中旬首次传出，两者高度吻合。在此之前，DeepSeek 曾坚持纯科研路线，拒绝商业化，由梁文锋个人出资维持实验室运营长达三年。然而，面对全球顶级实验室两三个月发布一次新模型的快节奏，DeepSeek 因适配国产芯片导致长达 15 个月未发布新一代模型的空窗期，使其在编程工具热潮中暂时缺席。

核心内容

1. 融资规模与个人投入 DeepSeek 完成了总额高达 74 亿美元的融资。其中，梁文锋个人出资 200 亿人民币（约 30 亿美元），占据了融资总额的约五分之二。融资完成后，DeepSeek 设立了员工持股计划，按实际估值分配股份，以激励团队。

2. 团队扩张与招聘计划 融资完成后，DeepSeek 罕见地发布公开声明，宣布所有部门招聘人数“至少翻倍”。目前公司总人数约为 300 人，扩张将覆盖 AI 系统开发、基础设施、产品开发和深度学习研究等核心领域。

Harness 团队：负责将模型转化为自主 AI 智能体的核心部门，已进入每天面试的状态。该团队负责人崔添翼于今年 3 月从 Jane Street 跳槽加入，并在社交媒体 X 上透露了高强度的招聘节奏。

3. 国产芯片适配与战略取舍 DeepSeek 正在加紧适配华为芯片。梁文锋相信华为芯片在几年内能追上英伟达的水平，并认为 DeepSeek 应率先完成适配。

技术代价：DeepSeek 原有的训练和部署系统基于英伟达 CUDA 软件搭建，适配华为芯片需要工程师重写底层软件，导致模型在国产芯片上高效运行面临巨大挑战。
研发空窗期：这一适配过程导致 DeepSeek 长达 15 个月没有发布任何新一代模型。相比之下，其他顶级实验室保持每两三个月发布一次新模型的高频节奏。
错失风口：DeepSeek 因此错过了去年下半年由 Anthropic Claude Code 掀起的编程工具热潮。但梁文锋在路演中向投资人解释，编程工具和 AI 聊天机器人只是 AI 进化中的“临时产物”，重注短期产品会偏离通往通用人工智能（AGI）的终极目标。

4. 商业模式与 AGI 愿景 梁文锋的战略核心保持不变：继续开源、保持低价、专注 AGI。

AGI 定义：机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。
价值观：梁文锋强调“AI 不应该被少数人控制”。DeepSeek 是目前唯一一家将所有模型底层代码完全公开的主要 AI 实验室。
市场表现：尽管研发节奏放缓，DeepSeek 在美国开发者群体中的存在感急速膨胀。今年 4 月发布的旗舰模型 V4，在 5 月于 Vercel 的 AI Gateway 平台上 token 用量份额从不到 1% 飙升至 17%，成为该平台仅次于 Anthropic 和 Google 的第三大模型。其轻量版 V4 Flash 的价格比 Anthropic 模型便宜 20 到 50 倍，这种增长势头在 6 月仍在持续。

关键要点

融资直接动因：Anthropic 的 Claude Mythos 展示了基于海量算力和数据的强大能力，促使梁文锋意识到 DeepSeek 必须储备充足资源以应对竞争。
巨额个人注资：梁文锋个人出资 30 亿美元（200 亿人民币），占 74 亿美元总融资额的 40%，显示其对公司的坚定承诺。
激进扩张：DeepSeek 计划将约 300 人的团队规模至少翻倍，重点招聘 AI 系统、基础设施、产品及深度学习研究人员。
国产替代战略：DeepSeek 选择优先适配华为芯片，尽管这需要重写底层软件并导致长达 15 个月的新模型发布空窗期。
长期主义视角：梁文锋认为编程工具等是短期产品，DeepSeek 放弃短期商业化风口，旨在专注实现 AGI 这一终极目标。
开源与低价策略：DeepSeek 坚持完全开源底层代码，并通过极具竞争力的低价策略（如 V4 Flash 比竞品便宜 20-50 倍）迅速占领市场份额。
市场认可度提升：旗舰模型 V4 在 Vercel 平台上的使用份额一个月内从不足 1% 跃升至 17%，确立其全球第三大模型的地位。

意义与影响

DeepSeek 的融资与战略调整标志着中国 AI 初创企业从“纯科研探索”向“大规模工业化竞争”的关键转折。

首先，算力与数据的军备竞赛升级。Claude Mythos 的成功证明，在基础模型领域，海量算力和数据仍是构建护城河的关键。DeepSeek 的融资不仅是为了追赶，更是为了在 AGI 的长跑中拥有足够的“弹药”。

其次，国产芯片生态的加速融合。DeepSeek 选择重注华为芯片，尽管面临巨大的技术重构成本，但这为国产 AI 硬件生态提供了重要的落地场景和反馈闭环。如果 DeepSeek 能成功适配并优化，将极大推动华为昇腾等国产芯片在高端 AI 训练领域的成熟度，减少对英伟达 CUDA 生态的依赖。

最后，开源与商业化的平衡探索。DeepSeek 通过“完全开源 + 极致低价”的策略，在全球范围内（尤其是美国开发者社区）建立了强大的品牌影响力和用户基础。这种模式挑战了传统闭源大模型的盈利逻辑，证明了通过降低使用门槛、扩大生态影响力，可以在追求 AGI 理想的同时获得市场回报。梁文锋“AI 不应被少数人控制”的理念，正在通过 DeepSeek 的行动转化为行业现实。

查看原文 →qbitai.com

DeepSeek不储备弹药难以为继，Claude Mythos或促梁文锋融资

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐