AI基础设施瓶颈转向网络,DPU成低估拼图
速览
过去六年AI行业焦点一直放在GPU上,但随着模型规模扩大和Agent时代到来,网络与数据调度已成为系统瓶颈。DPU从CPU时代的辅助角色,转变为连接计算、网络、存储的核心节点,能优化内存共享、降低时延并扩展上下文存储。云豹智能自主研发的400Gbps全功能DPU已进入真实数据中心并实现十万片规模商用,而英伟达也持续强化网络能力,预示AI基础设施竞争转向系统效率,DPU市场预计2030年规模达千亿级,中国市场将成增长最快细分领域。
AI 深度解读
深度解读:AI基础设施的下一个千亿市场,为何藏在网络里?
背景
过去六年,国产GPU公司凭借AI风口一路估值刷新,但DPU却被长期忽略。这一现象与产业现实不符。英伟达在2020年收购Mellanox后即确立“GPU+CPU+DPU”三芯战略,并持续强化网络能力。2026年CES上,黄仁勋展示“六芯组合”,四款均与网络相关,明确信号为AI基础设施竞争已从单芯片性能转向系统效率。
Agent时代到来后,AI系统从训练转向高频推理与持续运行,GPU利用率高度依赖网络效率。DPU从过去数据中心可选项,逐渐成为连接计算、网络与存储的系统级核心节点。云豹智能冲刺国产DPU第一股,招股书呈现在市场面前,标志着全功能DPU开始被重视。
核心内容
英伟达收购Mellanox后,DPU成为AI基础设施关键组件。过去以CPU通算为主的云计算时代,DPU主要承担网络、存储、安全等任务卸载。在Agent时代,DPU角色发生转变:在Scale Up场景下,优化单节点CPU与GPU内存共享与数据流动,降低时延,提升异构算力协同效率;在Scale Out场景中,负责大规模集群间数据调度与网络卸载,直接影响GPU利用率。
推理需求爆发进一步放大DPU作用。模型上下文窗口扩大,GPU显存成为成本瓶颈,DPU可在不增加硬件数量的情况下扩展AI系统有效可用内存。2026年GTC上,黄仁勋展示新一代DPU在KV-Cache分层存储上的演进。新一代Vera Rubin系统中,BlueField-4系列DPU承担KV-Cache管理与硬件加速,在GPU高速HBM与外部存储间构建“温数据层”,为每颗Rubin GPU动态分配16TB专用上下文空间,打破硬件瓶颈,将单Token推理成本降低90%。
全球DPU市场规模从2021年649.93亿元增长至2025年1964.91亿元,预计2030年达4362.39亿元;中国市场预计2030年达到1290.91亿元,成为AI基础设施增长最快细分领域。
DPU被低估原因在于:其本质是系统级芯片,涉及网络、计算、存储、虚拟化、安全隔离等多个领域,壁垒高于网卡。真正做全功能DPU的公司极少。英伟达早期BlueField系列(BF1、BF2)未被市场大量采用,直至收购后开发的BF3才成功。国内云豹智能是少数实现产品化与规模落地的独立厂商之一,唯一达到400Gbps的全功能DPU产品,对标英伟达BF3。
云豹智能创始人萧启阳24岁获斯坦福大学电子工程博士学位,博士论文《Discrete Neural Computation: A Theoretical Foundation》获马文·明斯基亲笔作序推荐,并获美国国家科学基金会青年研究员奖。团队曾任职于MIT(endowed-chair副教授)、博通、英特尔、ARM、华为海思、阿里巴巴等,之前在硅谷创办网络处理器公司后被博通以37亿美元收购。
云豹DPU首代产品在A0版本阶段即实现客户部署与量产,已在头部客户实现超过十万片规模化商用,应用于高性能计算、存储与网络卸载等业务。产品已在真实数据中心场景落地,保持相对低调。
2026年,云豹智能将在今年推出针对AI网络场景的DPU产品。800Gbps/1.6Tbps DPU产品即将推出市场。
中国DPU市场中,英伟达凭借架构积累、数据面处理能力和软件生态占据首位,云豹智能排名第二,在本土厂商中位列第一。中国信通院《DPU发展分析报告》显示,未来可能只剩下云豹与其他少数厂商。
云豹DPU入选中国国家博物馆《筑基强国路——中国制造“十四五”成就展》“国之重器”展区,成为重点展示。
DPU已被列入国家战略,成为算力基础设施自主可控的最后一环。IPO获深交所受理后,云豹智能向“国产DPU第一股”迈进,稀缺性获得资本市场关注。相比GPU市场拥挤,DPU厂商极少,具备全功能研发、量产与规模化落地能力的公司稀缺。
关键要点
- 英伟达收购Mellanox确立DPU战略,并通过网络能力强化系统效率,2026年CES展示六芯组合强调网络重要性
- Agent时代AI系统转向高频推理,DPU在Scale Up(节点内内存共享优化)和Scale Out(集群数据调度)场景中发挥核心作用
- 推理上下文扩大使GPU显存成瓶颈,DPU通过KV-Cache分层存储扩展有效内存,2026年GTC展示BlueField-4为Rubin GPU分配16TB专用空间,降低单Token成本90%
- 全球DPU市场2021-2025年从649.93亿元增至1964.91亿元,2030年预计4362.39亿元,中国市场2030年达1290.91亿元
- DPU本质为系统级芯片,壁垒高,英伟达早期BlueField未大规模采用,直至BF3成功;云豹智能400Gbps全功能DPU产品已十万片商用
- 云豹创始人萧启阳斯坦福电子工程博士,团队覆盖博通、英特尔、ARM、华为海思等,首代产品A0版本即客户部署量产
- 中国DPU市场英伟达第一,云豹第二,入选国家博物馆展区,成为算力基础设施自主可控关键,IPO获深交所受理
意义与影响
DPU市场扩张直接为AI基础设施提供系统级解决方案,提升GPU利用率、降低时延、优化资源效率,在数据中心、云计算、高性能计算、大模型推理、金融、运营商、能源等领域广泛应用。云豹智能等厂商持续技术演进,推动DPU从辅助向核心组件转型。
行业竞争格局收敛,未来仅剩少数具备全功能能力的玩家,稀缺性提升长期价值空间。国产DPU纳入国家战略,成为“卡脖子”到“基础底座”的关键,算力基础设施自主可控进入新阶段。资本市场重新评估DPU,相比GPU市场拥挤,具备研发、量产与落地能力的厂商(如云豹智能)拥有更大想象空间,成为AI基础设施赛道下一轮价值重估焦点。
