AI 资讯雷峰网·3 天前

英特尔发布288核至强6+，单芯片可运行500个AI Agent

原标题：一颗288核的至强6+，为什么能同时运行500个Agent？

速览

英特尔在Computex 2026发布基于Intel 18A工艺的至强6+处理器，拥有288个能效核。该CPU通过高密度封装与高性能内存，单芯片可轻松部署400至500个AI Agent，标志着AI基础设施从GPU主导转向CPU与GPU协同的新阶段。同时发布的E835网络适配器进一步解决了Agent时代的网络瓶颈问题。

AI 深度解读

背景

过去两年，AI基础设施行业存在一个近乎共识的观点：GPU决定了AI能力的上限。从大模型训练到推理部署，产业焦点几乎全部围绕GPU展开，显存容量、带宽以及Token吞吐量成为衡量基础设施能力的核心指标。

然而，随着AI从简单的问答生成转向复杂的任务执行，**Agent（智能体）**的兴起正在改变这一逻辑。与传统聊天机器人不同，Agent需要持续执行任务，涉及调用工具、访问数据库、浏览网页、管理记忆系统以及调度子Agent协同工作。在这一过程中，虽然GPU仍负责核心的内容生成，但大量的任务调度、编排、路由和资源管理工作重新落回了CPU身上。

在此背景下，英特尔在Computex 2026期间发布了首款基于Intel 18A工艺的数据中心处理器——至强6+（Xeon 6+，代号Clearwater Forest）。这款拥有288个能效核（E-Core）的处理器，在实际测试中能够同时部署400至500个Agent，标志着AI基础设施底层逻辑从“GPU主导”向“系统协同”的深刻转变。

核心内容

1. 至强6+（Xeon 6+）的技术架构与性能突破

至强6+的核心优势在于其极高的核心密度和针对Agent工作负载优化的架构设计。

3D封装与芯片堆叠：为了实现高密度，英特尔采用了Foveros Direct 3D三维封装技术。处理器由4个基于Intel 18A工艺的计算Tile垂直堆叠在基于Intel 3工艺的基底Tile之上，并通过EMIB封装技术互联。整颗处理器包含29个芯片组件：4个计算芯片（每个含24个核心，共288核）堆叠在3颗基底芯片上，基底芯片集成了片上网状互联、末级缓存和内存子系统。
内存与互联规格：配备12通道DDR5内存，最高速率8000 MT/s；末级缓存高达576MB，较上一代提升超5倍；提供96条PCIe Gen 5通道，确保数据流动无瓶颈。
性能表现：相比上一代产品，整体性能最高提升2.26倍，每瓦性能最高提升1.55倍。与同类竞品相比，每线程性能和每线程每瓦性能高出最多30%。
部署密度：按照云服务常见的“2核配4G内存”或“1核配2G内存”标准，一颗288核的至强6+轻松支持400至500个Agent的并发部署。对于使用第二代至强的客户，升级至强6+可实现9:1的服务器整合比，物理空间减少近80%，能源节省73%。

2. 网络成为新瓶颈：以太网E835控制器

随着数百个Agent同时工作，节点间的东西向流量激增，网络成为影响效率的关键因素。英特尔同步发布了全新的以太网E835控制器及网络适配器。

高吞吐量与灵活性：支持最高200GbE吞吐量，覆盖2×25GbE、4×25GbE、2×100GbE、1×200GbE等多种端口配置，可通过英特尔以太网端口配置工具（EPCT）灵活定制。
低延迟与低开销：支持RDMA（RoCEv2/iWARP），可绕过CPU直接在服务器间传输数据；动态设备个性化（DDP）技术降低了数据包处理开销。
能效优势：在满载200G线速运行时，E835功耗比主要竞争对手低28%至47%，实现1.4至1.9倍的每瓦性能优势。
电信场景适配：配合至强6+的高精度时钟提取功能，可在5G专网中以约10纳秒精度实现时钟同步。爱立信测试显示，在相同核心数下，性能提升30%，每瓦性能提升60%以上，机架功耗下降38%。

3. 面向Agent的GPU：代号Crescent Island

针对Agent对内存容量和上下文管理的巨大需求，英特尔推出了下一代数据中心GPU，代号Crescent Island。

超大显存容量：基于Xe 3P架构，搭载高达480GB的LPDDR5x显存。相比HBM，LPDDR5x功耗更低、成本更具竞争力，且整卡功耗控制在350W，可直接部署于现有风冷数据中心，无需液冷改造。
模型部署效率：以DeepSeek-V4模型为例，在FP8量化精度下，仅需4张Crescent Island即可支持完整部署。大显存允许在显存中保留多个模型，减少Agent切换任务时的加载延迟。
软件生态与兼容性：支持从FP4/MXFP4到FP64的广泛数据类型，采用PCIe兼容外形规格。英特尔构建了统一的Xe软件栈，支持PyTorch、vLLM、SGLang等主流框架，坚持上游优先策略，提供Day 0支持。

4. 战略转变：从CPU公司到AI系统公司

英特尔此次发布并非单一产品，而是一套完整的AI系统解决方案。

系统协同：强调CPU（控制平面）、GPU（推理平面）、网络（数据流动）和软件（资源编排）的协同运作。
旧技术的新价值：Agent对上下文频繁换入换出的需求，重新发掘了IAA（Intel In-Memory Analytics Accelerator）在内存压缩/解压加速方面的价值，以及CXL内存扩展在共享大容量内存池中的作用。
未来路线图：下一代至强CPU代号Diamond Rapids，基于Intel 18A P工艺，预计2027年发布，与至强6+保持Socket兼容性，确保客户无需重构基础设施即可升级。

关键要点

CPU角色回归：在Agent时代，CPU不再仅仅是辅助角色，而是负责任务调度、编排和资源管理的核心控制平面。CPU与GPU的配比正从传统的1:8向1:4、1:2甚至1:1转变。
至强6+的核心优势：首款单SoC支持288核的处理器，利用Intel 18A工艺和3D封装技术，实现了极高的核心密度和能效比，单颗芯片可支持400-500个Agent并发运行。
网络与内存成为新瓶颈：Agent的大规模部署使得网络带宽、时延以及显存容量成为关键限制因素。E835网卡和480GB显存的Crescent Island GPU分别针对这两大瓶颈提供了高效解决方案。
系统级竞争取代单芯片竞争：AI基础设施的竞争焦点已从单一芯片算力转向CPU、GPU、网络与软件生态共同构成的系统能力。
成本与能效优化：通过高整合比（9:1）和低功耗设计（如E835和Crescent Island），英特尔旨在降低数据中心的总体拥有成本（TCO），并适应现有风冷基础设施。
软件生态开放性：英特尔坚持上游优先策略，将硬件支持直接贡献给PyTorch等开源框架，确保开发者体验的一致性和兼容性。

意义与影响

至强6+及相关产品的发布，标志着AI基础设施行业进入了一个新阶段：Agent驱动的系统化时代。

首先，它打破了“GPU决定一切”的固有认知，重新确立了CPU在AI基础设施中不可替代的控制平面地位。随着AI从生成答案转向执行复杂任务，CPU在调度、并发处理和资源管理上的价值被极大放大。

其次，英特尔通过发布CPU、GPU、网络及软件栈的一体化方案，展示了其从“CPU公司”向“AI系统公司”的战略转型。这种系统级思维表明，未来的AI竞争不再是单点技术的比拼，而是整个数据中心架构协同效率的竞争。

最后，对于行业而言，这一趋势意味着数据中心架构需要重新设计。企业需要更加关注CPU与GPU的配比、网络东西向流量的优化以及内存容量的扩展性。英特尔提供的基于Intel 18A工艺和高密度封装的解决方案，为构建高密度、高能效的Agent基础设施提供了新的技术路径，同时也为

查看原文 →leiphone.com

英特尔发布288核至强6+，单芯片可运行500个AI Agent

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐