← 返回信息流
AI 资讯雷峰网·3 小时前

至强6+发布:CPU成Agent算力核心,QAT与IAA破解成本瓶颈

原标题:Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?

速览

随着Agentic AI兴起,数据中心CPU需求激增,英特尔发布首款基于Intel 18A制程的至强6+处理器以应对挑战。该处理器通过288个能效核支持高密度Agent部署,并引入QAT和IAA技术,有效缓解KV Cache带来的显存与存储成本压力。腾讯云、金山云等合作伙伴已验证其在提升并发处理能力和降低基础设施成本方面的显著成效,标志着CPU在AI算力架构中重回核心地位。

AI 深度解读

背景

当前 AI 算力基础设施正经历一场深刻的结构性变化。传统认知中,AI 数据中心是 GPU 的天下,CPU 与 GPU 的比例长期维持在 1:8 甚至更低。然而,随着 Agentic AI(智能体 AI)时代的到来,这一比例正在迅速向 1:4、1:2 乃至 1:1 演进。

这种转变的直接体现是 CPU 的突然缺货。英特尔数据显示,2026 年一季度中国 AI 算力需求同比暴涨 417%,某国内头部大模型厂商的 CPU 需求在过去一年中增长了 5 倍。这一反常现象的根源在于工作负载性质的改变:传统推理任务由 GPU 主导,而 Agent 需要持续执行调度工具、查询数据库、管理记忆及创建子 Agent 等复杂任务,这些工作绝大多数落在 CPU 上。

在此背景下,英特尔发布了首款基于 Intel 18A 制程的数据中心处理器至强 6+(Xeon 6+)。此次发布不仅展示了硬件规格,更通过与腾讯云、金山云、阿里云等合作伙伴的联合落地案例,回答了至强 6+ 如何将 Agentic AI 转化为实际生产力。

核心内容

至强 6+ 的核心竞争力在于其针对 Agentic AI 异构工作负载的架构设计,以及被重新激活的两项关键加速技术:QAT 和 IAA。

1. 高核心密度与异构架构的协同 至强 6+ 最高拥有 288 个能效核(E-Core)。通过软件调度优化,单个物理核心可同时运行 3 到 4 个 Agent 实例,使得单颗处理器能支持超过 1000 个 Agent 的稳定部署。

  • E-Core 的作用:负责处理 Agent 本体运行及大量“小步工作”,如调度、路由和工具调用。
  • P-Core 的作用:当 Agent 触发特定任务(如调用 SAP HANA 等数据库)时,需要高性能计算能力,此时由高性能核(P-Core)介入。
  • 架构逻辑:Agent 的工作负载是异构的,单一架构无法通吃。至强 6+ 提供 E-Core 和 P-Core 两条产品线,正是为了应对这种混合负载。

2. 打开 KV Cache 瓶颈的“两把金钥匙” 在 Agentic AI 场景中,大模型支持百万上下文,单个用户的 KV Cache 占用可达 10GB 以上。随着用户量增加,GPU 显存迅速耗尽,必须将 KV Cache 卸载至内存或 SSD,这带来了巨大的成本压力。英特尔通过 QAT 和 IAA 解决了这一痛点:

  • QAT(数据压缩加速引擎):解决 SSD 存储问题。通过硬件级压缩,KV Cache 在写入 SSD 前进行压缩,压缩比至少达到 50%(10GB 变为 5GB)。实测数据显示,使用 QAT 后压缩带宽提升 400%,通用 CPU 核数占用减少 75%。
  • IAA(内存分析加速器):解决内存资源问题。IAA 对内存数据进行实时压缩,且解压过程由硬件完成,不增加延迟。这使得 Agent 启动时占用内存更小,相同内存可运行更多 Agent。在沙箱场景中,IAA 可将快照延迟降低最高 60%,冷启动时间提升 30%。

3. 合作伙伴的落地实践

  • 腾讯云:作为至强 6+(Sierra Forest 系列)AP 平台的全球独占合作伙伴,将其应用于微信、腾讯广告检索等场景,利用 288 核及 576MB 三级缓存优势支撑高并发 Agent 负载。
  • 金山云:基于至强 6+ 的第十代云服务器 SE10,使 AI Agent 应用部署密度提升 80% 以上,Nginx 高并发吞吐提升 33%,MySQL CPU 性能提升 52%。
  • 火山引擎:依托英特尔至强处理器和 TDX 技术,构建 AICC 机密计算平台,实现多租户环境下 AI 数据与计算资源的全生命周期隔离,保障数据安全。
  • 新华三:其 X20000 存储平台借助至强 6+,在推理场景中使 TTFT 和 TPOT 性能提升最高 10 倍,存储成本下降 60%。

关键要点

  • CPU:GPU 配比重构:AI 算力需求结构发生根本性变化,CPU 需求激增,配比从 1:8 向 1:1 演进,CPU 缺货成为现实。
  • Agent 驱动 CPU 负载:Agent 的持续任务执行特性(调度、记忆管理、子 Agent 创建)主要消耗 CPU 资源,而非 GPU。
  • 至强 6+ 的核心优势
    • 基于 Intel 18A 制程,最高 288 个 E-Core。
    • 单颗支持超 1000 个 Agent 部署(基于激进软件调度优化)。
    • 异构核心设计(E-Core 处理轻量调度,P-Core 处理高性能计算)适配 Agent 混合负载。
  • QAT 与 IAA 的价值重估
    • 这两项技术并非新创,但在 Agentic AI 时代成为刚需。
    • QAT 通过硬件压缩大幅降低 SSD 存储需求和带宽压力。
    • IAA 通过内存实时压缩降低延迟并提高内存利用率,加速 Agent 冷启动。
  • 生产力转化验证:腾讯云、金山云、阿里云等头部云厂商已提供量化数据,证明至强 6+ 在部署密度、性能提升和成本降低方面的实际效果。
  • 未来兼容性:下一代至强 CPU(代号 Diamond Rapids,基于 Intel 18A P 工艺,2027 年发布)将与至强 6+ 保持 Socket 兼容性,保护客户基础设施投资。

意义与影响

至强 6+ 的发布及落地案例表明,AI 基础设施的叙事正从“GPU 统治世界”转向“CPU 与 GPU 协同”。Agent 时代的到来,重新定义了 CPU 在 AI 数据中心中的核心价值。

首先,成本结构优化。通过 QAT 和 IAA 技术,企业能够显著降低因 KV Cache 膨胀带来的存储和内存成本,使得大规模部署 Agentic AI 在经济上更具可行性。

其次,算力边界拓展。高核心密度的 CPU 使得单服务器能够承载更多 Agent,提高了资源利用率,重新定义了单服务器的性能边界。

最后,生态协同效应。英特尔与腾讯云、金山云等合作伙伴的深度绑定,证明了从技术实力到生产力的转化路径已经打通。这种基于长期技术积累(如 IAA、QAT 的多代演进)而非短期风口押注的策略,为 AI 基础设施的可持续发展提供了新的范式。随着 Diamond Rapids 等后续产品的推出,这一趋势将进一步巩固 CPU 在 Agentic AI 时代的关键地位。

查看原文 →leiphone.com