← 返回信息流
AI 资讯雷峰网·3 天前

英特尔发布288核至强6+,单芯片可运行500个AI Agent

原标题:一颗288核的至强6+,为什么能同时运行500个Agent?

速览

英特尔在Computex 2026发布基于Intel 18A工艺的至强6+处理器,拥有288个能效核。该CPU通过高密度封装与高性能内存,单芯片可轻松部署400至500个AI Agent,标志着AI基础设施从GPU主导转向CPU与GPU协同的新阶段。同时发布的E835网络适配器进一步解决了Agent时代的网络瓶颈问题。

AI 深度解读

背景

过去两年,AI基础设施行业存在一个近乎共识的观点:GPU决定了AI能力的上限。从大模型训练到推理部署,产业焦点几乎全部围绕GPU展开,显存容量、带宽以及Token吞吐量成为衡量基础设施能力的核心指标。

然而,随着AI从简单的问答生成转向复杂的任务执行,**Agent(智能体)**的兴起正在改变这一逻辑。与传统聊天机器人不同,Agent需要持续执行任务,涉及调用工具、访问数据库、浏览网页、管理记忆系统以及调度子Agent协同工作。在这一过程中,虽然GPU仍负责核心的内容生成,但大量的任务调度、编排、路由和资源管理工作重新落回了CPU身上。

在此背景下,英特尔在Computex 2026期间发布了首款基于Intel 18A工艺的数据中心处理器——至强6+(Xeon 6+,代号Clearwater Forest)。这款拥有288个能效核(E-Core)的处理器,在实际测试中能够同时部署400至500个Agent,标志着AI基础设施底层逻辑从“GPU主导”向“系统协同”的深刻转变。

核心内容

1. 至强6+(Xeon 6+)的技术架构与性能突破

至强6+的核心优势在于其极高的核心密度和针对Agent工作负载优化的架构设计。

  • 3D封装与芯片堆叠:为了实现高密度,英特尔采用了Foveros Direct 3D三维封装技术。处理器由4个基于Intel 18A工艺的计算Tile垂直堆叠在基于Intel 3工艺的基底Tile之上,并通过EMIB封装技术互联。整颗处理器包含29个芯片组件:4个计算芯片(每个含24个核心,共288核)堆叠在3颗基底芯片上,基底芯片集成了片上网状互联、末级缓存和内存子系统。
  • 内存与互联规格:配备12通道DDR5内存,最高速率8000 MT/s;末级缓存高达576MB,较上一代提升超5倍;提供96条PCIe Gen 5通道,确保数据流动无瓶颈。
  • 性能表现:相比上一代产品,整体性能最高提升2.26倍,每瓦性能最高提升1.55倍。与同类竞品相比,每线程性能和每线程每瓦性能高出最多30%。
  • 部署密度:按照云服务常见的“2核配4G内存”或“1核配2G内存”标准,一颗288核的至强6+轻松支持400至500个Agent的并发部署。对于使用第二代至强的客户,升级至强6+可实现9:1的服务器整合比,物理空间减少近80%,能源节省73%。

2. 网络成为新瓶颈:以太网E835控制器

随着数百个Agent同时工作,节点间的东西向流量激增,网络成为影响效率的关键因素。英特尔同步发布了全新的以太网E835控制器及网络适配器。

  • 高吞吐量与灵活性:支持最高200GbE吞吐量,覆盖2×25GbE、4×25GbE、2×100GbE、1×200GbE等多种端口配置,可通过英特尔以太网端口配置工具(EPCT)灵活定制。
  • 低延迟与低开销:支持RDMA(RoCEv2/iWARP),可绕过CPU直接在服务器间传输数据;动态设备个性化(DDP)技术降低了数据包处理开销。
  • 能效优势:在满载200G线速运行时,E835功耗比主要竞争对手低28%至47%,实现1.4至1.9倍的每瓦性能优势。
  • 电信场景适配:配合至强6+的高精度时钟提取功能,可在5G专网中以约10纳秒精度实现时钟同步。爱立信测试显示,在相同核心数下,性能提升30%,每瓦性能提升60%以上,机架功耗下降38%。

3. 面向Agent的GPU:代号Crescent Island

针对Agent对内存容量和上下文管理的巨大需求,英特尔推出了下一代数据中心GPU,代号Crescent Island

  • 超大显存容量:基于Xe 3P架构,搭载高达480GB的LPDDR5x显存。相比HBM,LPDDR5x功耗更低、成本更具竞争力,且整卡功耗控制在350W,可直接部署于现有风冷数据中心,无需液冷改造。
  • 模型部署效率:以DeepSeek-V4模型为例,在FP8量化精度下,仅需4张Crescent Island即可支持完整部署。大显存允许在显存中保留多个模型,减少Agent切换任务时的加载延迟。
  • 软件生态与兼容性:支持从FP4/MXFP4到FP64的广泛数据类型,采用PCIe兼容外形规格。英特尔构建了统一的Xe软件栈,支持PyTorch、vLLM、SGLang等主流框架,坚持上游优先策略,提供Day 0支持。

4. 战略转变:从CPU公司到AI系统公司

英特尔此次发布并非单一产品,而是一套完整的AI系统解决方案。

  • 系统协同:强调CPU(控制平面)、GPU(推理平面)、网络(数据流动)和软件(资源编排)的协同运作。
  • 旧技术的新价值:Agent对上下文频繁换入换出的需求,重新发掘了IAA(Intel In-Memory Analytics Accelerator)在内存压缩/解压加速方面的价值,以及CXL内存扩展在共享大容量内存池中的作用。
  • 未来路线图:下一代至强CPU代号Diamond Rapids,基于Intel 18A P工艺,预计2027年发布,与至强6+保持Socket兼容性,确保客户无需重构基础设施即可升级。

关键要点

  • CPU角色回归:在Agent时代,CPU不再仅仅是辅助角色,而是负责任务调度、编排和资源管理的核心控制平面。CPU与GPU的配比正从传统的1:8向1:4、1:2甚至1:1转变。
  • 至强6+的核心优势:首款单SoC支持288核的处理器,利用Intel 18A工艺和3D封装技术,实现了极高的核心密度和能效比,单颗芯片可支持400-500个Agent并发运行。
  • 网络与内存成为新瓶颈:Agent的大规模部署使得网络带宽、时延以及显存容量成为关键限制因素。E835网卡和480GB显存的Crescent Island GPU分别针对这两大瓶颈提供了高效解决方案。
  • 系统级竞争取代单芯片竞争:AI基础设施的竞争焦点已从单一芯片算力转向CPU、GPU、网络与软件生态共同构成的系统能力。
  • 成本与能效优化:通过高整合比(9:1)和低功耗设计(如E835和Crescent Island),英特尔旨在降低数据中心的总体拥有成本(TCO),并适应现有风冷基础设施。
  • 软件生态开放性:英特尔坚持上游优先策略,将硬件支持直接贡献给PyTorch等开源框架,确保开发者体验的一致性和兼容性。

意义与影响

至强6+及相关产品的发布,标志着AI基础设施行业进入了一个新阶段:Agent驱动的系统化时代

首先,它打破了“GPU决定一切”的固有认知,重新确立了CPU在AI基础设施中不可替代的控制平面地位。随着AI从生成答案转向执行复杂任务,CPU在调度、并发处理和资源管理上的价值被极大放大。

其次,英特尔通过发布CPU、GPU、网络及软件栈的一体化方案,展示了其从“CPU公司”向“AI系统公司”的战略转型。这种系统级思维表明,未来的AI竞争不再是单点技术的比拼,而是整个数据中心架构协同效率的竞争。

最后,对于行业而言,这一趋势意味着数据中心架构需要重新设计。企业需要更加关注CPU与GPU的配比、网络东西向流量的优化以及内存容量的扩展性。英特尔提供的基于Intel 18A工艺和高密度封装的解决方案,为构建高密度、高能效的Agent基础设施提供了新的技术路径,同时也为

查看原文 →leiphone.com