DeepSeek不储备弹药难以为继,Claude Mythos或促梁文锋融资
速览
DeepSeek在激烈的AI竞争中面临资金消耗过大的挑战,若不储备充足弹药将难以持续运营。在此背景下,Claude Mythos等新技术的出现加剧了行业竞争态势。这一局势可能促使DeepSeek创始人梁文锋加速融资决策,以确保持续的研发投入和市场竞争力。
AI 深度解读
背景
近期,AI 领域的竞争格局因 Anthropic 发布的 Claude Mythos 模型而发生重大变化。据 The Information 报道,DeepSeek 创始人梁文锋在目睹 Claude Mythos 通过海量算力和数据展现出超强能力后,意识到 DeepSeek 若不储备充足的“弹药”(资金与算力资源),将无法在激烈的技术竞赛中维持生存与发展。这一认知直接促成了 DeepSeek 启动大规模融资计划。
时间线上,Anthropic 于今年 4 月发布了 Claude 的预览版,而 DeepSeek 的融资传闻也在同年 4 月中旬首次传出,两者高度吻合。在此之前,DeepSeek 曾坚持纯科研路线,拒绝商业化,由梁文锋个人出资维持实验室运营长达三年。然而,面对全球顶级实验室两三个月发布一次新模型的快节奏,DeepSeek 因适配国产芯片导致长达 15 个月未发布新一代模型的空窗期,使其在编程工具热潮中暂时缺席。
核心内容
1. 融资规模与个人投入 DeepSeek 完成了总额高达 74 亿美元的融资。其中,梁文锋个人出资 200 亿人民币(约 30 亿美元),占据了融资总额的约五分之二。融资完成后,DeepSeek 设立了员工持股计划,按实际估值分配股份,以激励团队。
2. 团队扩张与招聘计划 融资完成后,DeepSeek 罕见地发布公开声明,宣布所有部门招聘人数“至少翻倍”。目前公司总人数约为 300 人,扩张将覆盖 AI 系统开发、基础设施、产品开发和深度学习研究等核心领域。
- Harness 团队:负责将模型转化为自主 AI 智能体的核心部门,已进入每天面试的状态。该团队负责人崔添翼于今年 3 月从 Jane Street 跳槽加入,并在社交媒体 X 上透露了高强度的招聘节奏。
3. 国产芯片适配与战略取舍 DeepSeek 正在加紧适配华为芯片。梁文锋相信华为芯片在几年内能追上英伟达的水平,并认为 DeepSeek 应率先完成适配。
- 技术代价:DeepSeek 原有的训练和部署系统基于英伟达 CUDA 软件搭建,适配华为芯片需要工程师重写底层软件,导致模型在国产芯片上高效运行面临巨大挑战。
- 研发空窗期:这一适配过程导致 DeepSeek 长达 15 个月没有发布任何新一代模型。相比之下,其他顶级实验室保持每两三个月发布一次新模型的高频节奏。
- 错失风口:DeepSeek 因此错过了去年下半年由 Anthropic Claude Code 掀起的编程工具热潮。但梁文锋在路演中向投资人解释,编程工具和 AI 聊天机器人只是 AI 进化中的“临时产物”,重注短期产品会偏离通往通用人工智能(AGI)的终极目标。
4. 商业模式与 AGI 愿景 梁文锋的战略核心保持不变:继续开源、保持低价、专注 AGI。
- AGI 定义:机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。
- 价值观:梁文锋强调“AI 不应该被少数人控制”。DeepSeek 是目前唯一一家将所有模型底层代码完全公开的主要 AI 实验室。
- 市场表现:尽管研发节奏放缓,DeepSeek 在美国开发者群体中的存在感急速膨胀。今年 4 月发布的旗舰模型 V4,在 5 月于 Vercel 的 AI Gateway 平台上 token 用量份额从不到 1% 飙升至 17%,成为该平台仅次于 Anthropic 和 Google 的第三大模型。其轻量版 V4 Flash 的价格比 Anthropic 模型便宜 20 到 50 倍,这种增长势头在 6 月仍在持续。
关键要点
- 融资直接动因:Anthropic 的 Claude Mythos 展示了基于海量算力和数据的强大能力,促使梁文锋意识到 DeepSeek 必须储备充足资源以应对竞争。
- 巨额个人注资:梁文锋个人出资 30 亿美元(200 亿人民币),占 74 亿美元总融资额的 40%,显示其对公司的坚定承诺。
- 激进扩张:DeepSeek 计划将约 300 人的团队规模至少翻倍,重点招聘 AI 系统、基础设施、产品及深度学习研究人员。
- 国产替代战略:DeepSeek 选择优先适配华为芯片,尽管这需要重写底层软件并导致长达 15 个月的新模型发布空窗期。
- 长期主义视角:梁文锋认为编程工具等是短期产品,DeepSeek 放弃短期商业化风口,旨在专注实现 AGI 这一终极目标。
- 开源与低价策略:DeepSeek 坚持完全开源底层代码,并通过极具竞争力的低价策略(如 V4 Flash 比竞品便宜 20-50 倍)迅速占领市场份额。
- 市场认可度提升:旗舰模型 V4 在 Vercel 平台上的使用份额一个月内从不足 1% 跃升至 17%,确立其全球第三大模型的地位。
意义与影响
DeepSeek 的融资与战略调整标志着中国 AI 初创企业从“纯科研探索”向“大规模工业化竞争”的关键转折。
首先,算力与数据的军备竞赛升级。Claude Mythos 的成功证明,在基础模型领域,海量算力和数据仍是构建护城河的关键。DeepSeek 的融资不仅是为了追赶,更是为了在 AGI 的长跑中拥有足够的“弹药”。
其次,国产芯片生态的加速融合。DeepSeek 选择重注华为芯片,尽管面临巨大的技术重构成本,但这为国产 AI 硬件生态提供了重要的落地场景和反馈闭环。如果 DeepSeek 能成功适配并优化,将极大推动华为昇腾等国产芯片在高端 AI 训练领域的成熟度,减少对英伟达 CUDA 生态的依赖。
最后,开源与商业化的平衡探索。DeepSeek 通过“完全开源 + 极致低价”的策略,在全球范围内(尤其是美国开发者社区)建立了强大的品牌影响力和用户基础。这种模式挑战了传统闭源大模型的盈利逻辑,证明了通过降低使用门槛、扩大生态影响力,可以在追求 AGI 理想的同时获得市场回报。梁文锋“AI 不应被少数人控制”的理念,正在通过 DeepSeek 的行动转化为行业现实。
