高通发布数据中心路线图及飞龙AI300等全栈解决方案
速览
高通技术公司在投资者日上发布面向智能体AI时代的数据中心技术路线图,推出涵盖飞龙C1000 CPU、高带宽计算(HBC)技术及飞龙AI300推理加速器的全新解决方案。该方案旨在突破内存带宽瓶颈,显著降低单位Token能耗与总体拥有成本,并已获得超35家行业领军企业支持。高通计划通过年度迭代的多代AI加速器路线,为超大规模云服务商提供高性能、低功耗的分布式机架级AI推理平台。
AI 深度解读
背景
随着智能体(Agent)AI 成为主流工作负载,数据中心对 AI 推理的需求呈现爆发式增长。这一趋势对基础设施提出了严峻挑战:必须在更低功耗和更低成本的前提下,实现更高性能的计算能力。传统的单一硬件组件已无法满足分布式、始终在线的基础设施需求,特别是在内存带宽和功耗方面存在关键瓶颈。
在此背景下,高通技术公司(Qualcomm)于 2026 年 6 月 25 日在纽约举行的投资者日活动上,正式发布了面向智能体 AI 时代的全新数据中心技术路线图。该路线图旨在通过全栈解决方案,最大化每瓦特性能与 Token 吞吐能力,同时降低客户的总体拥有成本(TCO)。这标志着高通将其在低功耗设计、高性能处理和领先 IP 方面的深厚积累,从移动终端延伸至大型数据中心基础设施领域。
核心内容
高通此次发布的全新数据中心解决方案是一个涵盖 CPU、AI 加速器、内存技术及连接技术的完整平台,专为超大规模云服务商和智能体密集型推理负载设计。
1. 高通飞龙™ C1000 CPU 这是专为数据中心打造的中央处理器,旨在为智能体、通用型和 AI 管理节点工作负载提供领先的性能与资源利用效率。
- 架构设计:采用高通 Oryon™ CPU 核心,针对核心性能和 5GHz 以上频率进行优化。采用超过 250 核的核心设计,结合多芯粒互联架构和先进封装工艺,支持模块化集成与 IO 扩展。
- 性能表现:预计每瓦特性能较现有服务器 CPU 竞品基准数据提升超过 2 倍。支持速率高达 2TB/s 的 PCIe 7.0 和 CXL 连接技术,适配下一代加速器、高速网络和分布式内存架构。
- 内存与散热:采用行业领先的低功耗内存技术,提供超高带宽、大容量和低时延。支持风冷与液冷散热,符合 OCP ORv3 标准。
- 产品线:包括面向高吞吐智能体调度的智能体 CPU、面向自有业务负载的通用 CPU,以及专为最大化生成式 AI 计算场景设计的 AI CPU。
- 商用时间:预计于 2028 年实现商用。
2. 高通高带宽计算(HBC)技术 HBC 技术旨在突破内存带宽瓶颈,解决 AI 计算中的数据搬运问题。
- 技术原理:采用创新的专用近存计算架构,通过 3D 堆叠硅基解决方案将计算与超高速带宽内存相融合。
- 性能优势:相较高带宽内存(HBM),HBC 具备更快速、更高效且扩展性更强的处理能力。
- 搭载第一代 HBC 技术的 AI250,单卡带宽达 133TB/s,有效内存带宽较采用 LPDDR5X 的 AI200 提升 18 倍。
- 搭载第二代 HBC 技术的 AI300,有效内存带宽较 AI200 提升 54 倍。
- 每瓦特带宽相比 HBM 技术提升 6 倍;每瓦特存储容量为 SRAM 技术的 200 倍。
- 商用时间:搭载第一代 HBC 技术的 AI250 预计于 2027 年年中商用出样。
3. 高通飞龙 AI300 推理加速器 作为继 AI200、AI250 之后的第三代机架级 AI 推理平台,AI300 集成了突破性的第二代高通 HBC 技术。
- 核心能力:支持集成内存和更高的有效内存带宽,面向分布式推理部署设计,为大语言模型(LLM)、多模态大模型(LMM)及智能体 AI 工作负载提供高吞吐量、低时延性能。
- 扩展性:支持通过 UALink(超加速器链路)与 ESUN(以太网纵向扩展网络)进行纵向扩展,并支持基于铜缆与光缆的横向扩展。
- 能效表现:与现有的基于 GPU 的架构相比,AI300 在单卡每瓦特内存带宽方面预计可实现 4 至 8 倍的提升。
- 商用时间:预计于 2028 年商用出样。
4. 定制芯片与连接技术
- 定制芯片:面向下一代 AI 与云数据中心,提供规模化客户定制芯片。具备跨芯片、系统和软件的端到端协同设计能力,支持从设计到大规模量产的全流程交付,旨在加速产品上市周期并降低执行风险。
- 连接技术:涵盖 Die-to-Die 芯片互联、铜缆连接、光互联及园区级长距互联。支持 800G 和 1.6T 高带宽连接,集成串行解串器(SerDes)、PAM4、轻量化相干 DSP 等技术,解决分布式基础设施中的数据传输瓶颈。
关键要点
- 全栈解决方案:推出涵盖高通飞龙 C1000 CPU、HBC 技术、AI300 推理加速器、连接产品及定制芯片的完整数据中心解决方案,聚焦最大化每瓦特性能和 Token 吞吐能力。
- AI 加速器迭代路线图:高通飞龙 AI300 与已有的 AI200、AI250 共同构成逐年迭代的多代 AI 加速器技术路线图,以年度为迭代周期。
- 内存带宽突破:高通高带宽计算(HBC)技术通过近存计算架构,显著降低单位 Token 能耗,每瓦特带宽较 HBM 提升 6 倍,有效内存带宽较 AI200 提升 54 倍(AI300 搭载第二代 HBC)。
- 重大合作伙伴关系:与 Meta 达成多年、多代合作协议,高通将成为 Meta 数据中心多代 CPU 的供应商,Meta 下一代服务器集群将搭载高通飞龙 C1000。
- 广泛的生态支持:获得科技生态内超 35 家行业领军企业的支持,包括爱德万测试、Arista、Astera、台达、富士康、联想、美光、三星 SDS、SK 海力士、Supermicro 等。
- 商用时间表:
- AI250(搭载第一代 HBC):预计 2027 年年中商用出样。
- C1000 CPU 与 AI300:预计 2028 年商用出样。
意义与影响
高通此次发布的数据中心技术路线图,不仅是其产品线向数据中心领域的重大延伸,更是对当前 AI 基础设施格局的一次重要重塑。
首先,挑战了 GPU 主导的推理市场。通过提供专注于能效和 Token 经济性的替代方案,高通试图在智能体 AI 推理这一快速增长的市场中占据一席之地。AI300 相比现有 GPU 架构在每瓦特内存带宽上的显著优势,直接回应了数据中心对降低 TCO 的迫切需求。
其次,确立了“机架级”基础设施的新范式。高通不再仅仅提供单一芯片,而是提供从 CPU、AI 加速器到内存和连接的统一机架级平台。这种分布式、解耦式的设计思路,旨在解决大规模部署中的集成复杂性和性能瓶颈,为超大规模云服务商提供了更具整体优化能力的选择。
最后,生态系统的扩张与验证。与 Meta 的长期合作以及 35 多家行业领军企业的支持,表明高通的技术路线得到了关键客户和供应链伙伴的认可。这不仅增强了高通在数据中心领域的可信度,也为其后续产品的商业化落地奠定了坚实的生态基础。随着 2027 年和 2028 年产品的陆续推出,高通有望在 AI 推理基础设施领域形成独特的竞争优势,推动行业向更高能效、更低成本的方向发展。
