AI 资讯雷峰网·4 小时前

高通发布数据中心路线图及飞龙AI300等全栈解决方案

原标题：高通发布面向智能体AI时代的数据中心技术路线图，推出全新高通飞龙产品组合

速览

高通技术公司在投资者日上发布面向智能体AI时代的数据中心技术路线图，推出涵盖飞龙C1000 CPU、高带宽计算（HBC）技术及飞龙AI300推理加速器的全新解决方案。该方案旨在突破内存带宽瓶颈，显著降低单位Token能耗与总体拥有成本，并已获得超35家行业领军企业支持。高通计划通过年度迭代的多代AI加速器路线，为超大规模云服务商提供高性能、低功耗的分布式机架级AI推理平台。

AI 深度解读

背景

随着智能体（Agent）AI 成为主流工作负载，数据中心对 AI 推理的需求呈现爆发式增长。这一趋势对基础设施提出了严峻挑战：必须在更低功耗和更低成本的前提下，实现更高性能的计算能力。传统的单一硬件组件已无法满足分布式、始终在线的基础设施需求，特别是在内存带宽和功耗方面存在关键瓶颈。

在此背景下，高通技术公司（Qualcomm）于 2026 年 6 月 25 日在纽约举行的投资者日活动上，正式发布了面向智能体 AI 时代的全新数据中心技术路线图。该路线图旨在通过全栈解决方案，最大化每瓦特性能与 Token 吞吐能力，同时降低客户的总体拥有成本（TCO）。这标志着高通将其在低功耗设计、高性能处理和领先 IP 方面的深厚积累，从移动终端延伸至大型数据中心基础设施领域。

核心内容

高通此次发布的全新数据中心解决方案是一个涵盖 CPU、AI 加速器、内存技术及连接技术的完整平台，专为超大规模云服务商和智能体密集型推理负载设计。

1. 高通飞龙™ C1000 CPU 这是专为数据中心打造的中央处理器，旨在为智能体、通用型和 AI 管理节点工作负载提供领先的性能与资源利用效率。

架构设计：采用高通 Oryon™ CPU 核心，针对核心性能和 5GHz 以上频率进行优化。采用超过 250 核的核心设计，结合多芯粒互联架构和先进封装工艺，支持模块化集成与 IO 扩展。
性能表现：预计每瓦特性能较现有服务器 CPU 竞品基准数据提升超过 2 倍。支持速率高达 2TB/s 的 PCIe 7.0 和 CXL 连接技术，适配下一代加速器、高速网络和分布式内存架构。
内存与散热：采用行业领先的低功耗内存技术，提供超高带宽、大容量和低时延。支持风冷与液冷散热，符合 OCP ORv3 标准。
产品线：包括面向高吞吐智能体调度的智能体 CPU、面向自有业务负载的通用 CPU，以及专为最大化生成式 AI 计算场景设计的 AI CPU。
商用时间：预计于 2028 年实现商用。

2. 高通高带宽计算（HBC）技术 HBC 技术旨在突破内存带宽瓶颈，解决 AI 计算中的数据搬运问题。

技术原理：采用创新的专用近存计算架构，通过 3D 堆叠硅基解决方案将计算与超高速带宽内存相融合。
性能优势：相较高带宽内存（HBM），HBC 具备更快速、更高效且扩展性更强的处理能力。
- 搭载第一代 HBC 技术的 AI250，单卡带宽达 133TB/s，有效内存带宽较采用 LPDDR5X 的 AI200 提升 18 倍。
- 搭载第二代 HBC 技术的 AI300，有效内存带宽较 AI200 提升 54 倍。
- 每瓦特带宽相比 HBM 技术提升 6 倍；每瓦特存储容量为 SRAM 技术的 200 倍。
商用时间：搭载第一代 HBC 技术的 AI250 预计于 2027 年年中商用出样。

3. 高通飞龙 AI300 推理加速器 作为继 AI200、AI250 之后的第三代机架级 AI 推理平台，AI300 集成了突破性的第二代高通 HBC 技术。

核心能力：支持集成内存和更高的有效内存带宽，面向分布式推理部署设计，为大语言模型（LLM）、多模态大模型（LMM）及智能体 AI 工作负载提供高吞吐量、低时延性能。
扩展性：支持通过 UALink（超加速器链路）与 ESUN（以太网纵向扩展网络）进行纵向扩展，并支持基于铜缆与光缆的横向扩展。
能效表现：与现有的基于 GPU 的架构相比，AI300 在单卡每瓦特内存带宽方面预计可实现 4 至 8 倍的提升。
商用时间：预计于 2028 年商用出样。

4. 定制芯片与连接技术

定制芯片：面向下一代 AI 与云数据中心，提供规模化客户定制芯片。具备跨芯片、系统和软件的端到端协同设计能力，支持从设计到大规模量产的全流程交付，旨在加速产品上市周期并降低执行风险。
连接技术：涵盖 Die-to-Die 芯片互联、铜缆连接、光互联及园区级长距互联。支持 800G 和 1.6T 高带宽连接，集成串行解串器（SerDes）、PAM4、轻量化相干 DSP 等技术，解决分布式基础设施中的数据传输瓶颈。

关键要点

全栈解决方案：推出涵盖高通飞龙 C1000 CPU、HBC 技术、AI300 推理加速器、连接产品及定制芯片的完整数据中心解决方案，聚焦最大化每瓦特性能和 Token 吞吐能力。
AI 加速器迭代路线图：高通飞龙 AI300 与已有的 AI200、AI250 共同构成逐年迭代的多代 AI 加速器技术路线图，以年度为迭代周期。
内存带宽突破：高通高带宽计算（HBC）技术通过近存计算架构，显著降低单位 Token 能耗，每瓦特带宽较 HBM 提升 6 倍，有效内存带宽较 AI200 提升 54 倍（AI300 搭载第二代 HBC）。
重大合作伙伴关系：与 Meta 达成多年、多代合作协议，高通将成为 Meta 数据中心多代 CPU 的供应商，Meta 下一代服务器集群将搭载高通飞龙 C1000。
广泛的生态支持：获得科技生态内超 35 家行业领军企业的支持，包括爱德万测试、Arista、Astera、台达、富士康、联想、美光、三星 SDS、SK 海力士、Supermicro 等。
商用时间表：
- AI250（搭载第一代 HBC）：预计 2027 年年中商用出样。
- C1000 CPU 与 AI300：预计 2028 年商用出样。

意义与影响

高通此次发布的数据中心技术路线图，不仅是其产品线向数据中心领域的重大延伸，更是对当前 AI 基础设施格局的一次重要重塑。

首先，挑战了 GPU 主导的推理市场。通过提供专注于能效和 Token 经济性的替代方案，高通试图在智能体 AI 推理这一快速增长的市场中占据一席之地。AI300 相比现有 GPU 架构在每瓦特内存带宽上的显著优势，直接回应了数据中心对降低 TCO 的迫切需求。

其次，确立了“机架级”基础设施的新范式。高通不再仅仅提供单一芯片，而是提供从 CPU、AI 加速器到内存和连接的统一机架级平台。这种分布式、解耦式的设计思路，旨在解决大规模部署中的集成复杂性和性能瓶颈，为超大规模云服务商提供了更具整体优化能力的选择。

最后，生态系统的扩张与验证。与 Meta 的长期合作以及 35 多家行业领军企业的支持，表明高通的技术路线得到了关键客户和供应链伙伴的认可。这不仅增强了高通在数据中心领域的可信度，也为其后续产品的商业化落地奠定了坚实的生态基础。随着 2027 年和 2028 年产品的陆续推出，高通有望在 AI 推理基础设施领域形成独特的竞争优势，推动行业向更高能效、更低成本的方向发展。

查看原文 →leiphone.com

高通发布数据中心路线图及飞龙AI300等全栈解决方案

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐