← 返回信息流
AI 资讯量子位·4 小时前

华为云启动Agentic新基建,重构Agent时代地基

原标题:Agent时代,华为云开始重新造地基了

速览

华为云正式推出Agentic新基建战略,标志着其在AI Agent领域的深度布局。此举意在为即将到来的Agent时代重新构建底层技术地基,解决复杂智能体应用的基础设施需求。这反映了华为云在云计算与人工智能融合领域的最新技术演进方向。

AI 深度解读

背景

随着 Agentic AI(智能体)时代的到来,企业级应用正面临从“对话式交互”向“自主执行任务”的范式转移。然而,当前的基础设施并未完全适配这一转变。许多开发者抱怨现有的 Agent 存在反应慢、上下文记忆缺失(“失忆”)、多步决策能力弱以及安全边界模糊等问题。这些问题并非单纯通过调整 Prompt 或更换大模型即可解决,其根源在于底层算力、存储、调度及安全架构尚未为 Agent 的高并发、长上下文、实时响应及自主操作需求做好准备。

在此背景下,华为云于 6 月 5 日在上海举办 INSPIRE 创想者大会,旨在通过重构底层基础设施,解决 Agent 在算力、记忆、调度和安全方面的核心卡点,并推动 AI 在垂直行业的深度落地。

核心内容

华为云在大会上发布了一系列针对 Agentic 场景的新基建产品,并提出了“行业 AI 梦工厂”及“先进公共云”等战略概念,具体内容如下:

1. Agentic 新基建:四大核心产品

华为云发布了四款新产品,分别解决 Agent 时代的四大基础痛点:

  • AICS 灵衢智算集群(解决“算得快”)

    • 痛点:Agent 需要连续推理和多步决策,算力需求远超传统大模型,Token 消耗量级巨大。
    • 能力:实现成千上万张芯片的高效协同,提供低时延、高吞吐、高可用服务。
    • 指标:推理时延压至 10 毫秒以内;集群规模支持 10 万卡;单集群算力达 200 EFLOPS;千卡每秒吞吐 500 万 Tokens;在线推理服务可用度达 99.95%。华为云宣称其为国产智算云 Top 1。
  • AMS Agentic 记忆存储(解决“记得住”)

    • 痛点:长上下文场景下 Agent 容易遗忘,且企业场景需要沉淀经验和理解用户偏好。
    • 能力:提供 PB 级记忆空间(规模比业界大一倍),采用全新盘级存储架构加三合一芯片,实现 TB 级读取速度。
    • 指标:整体性能领先业界 50%;通过 DRAM 内存池化与分层联动,记忆缓存命中率高达 95%。
  • CCE Volcano Next(解决“调得动”)

    • 痛点:企业场景中训练、推理、Agent 执行和存储调用并发运行,资源竞争激烈。
    • 能力:作为算力调度引擎,协同调度通算、智算和存储资源,确保互不干扰且可共享。
    • 指标:典型场景资源利用率提高 30%,从而降低算力成本。
  • AgentSphere(解决“安全可靠”)

    • 痛点:Agent 具备自主操作能力,存在越权、泄密及行为不可追溯的风险。
    • 能力:提供内核级沙箱隔离、双向网络防护、会话级权限管控及恶意意图防控,打造“安全工作间”。
    • 指标:羽量级沙箱启动时间达 100 毫秒级;每分钟可创建/销毁十万个沙箱,支撑 Agent 训练与运行不卡顿。

2. 平台层升级:ModelArts Next

重新定义 MaaS(模型即服务),从单纯的 API 调用升级为提供全套能力:

  • 模型矩阵:集成 DeepSeek、Kimi、GLM 等主流模型,实现 Day 0 上架。
  • 模型路由:自动匹配最合适的模型,调度策略精准率超 95%,调用成本平均降低 20% 以上。
  • 机密推理:依托硬件级 TEE(可信执行环境),确保敏感数据用完即销毁,连云厂商运维人员也无法触碰。
  • RLaaS:支持 1 分钟建任务、超 10 天长稳训练。案例显示,云南交投使用该能力进行交通流量预测,精度提升约 10%。

3. 交互入口变革:“智果园”

  • 概念:面向“硅基用户”(Agent)的云入口。
  • 功能:将分散在云控制台的产品、资源和流程重组为 Agent 可调用能力。用户只需在对话框下达目标,Agent 即可自主完成买云、建云、用云、管云的操作。
  • 意义:云平台从给人看的操作界面,转变为可被智能体理解、调用和执行的基础设施。

4. 行业落地:“行业 AI 梦工厂”

华为云 CEO 周跃峰提出此概念,旨在开放技术能力、工具链和行业经验,赋能开发者。首批及重点专区包括:

  • 智慧医疗专区
    • 提供智慧病理服务,支持“少样本训练”和“消费级 PC 推理”。
    • 基于上海瑞金医院临床经验及华为 ICT 技术,医生可用日常电脑部署专属病理模型,训练数据量仅为传统方案的十分之一。
    • 已覆盖全国各级医院,另有 20 多家医院入驻,医疗 AI 使能平台将于 6 月 30 日公测。
  • 具身智能专区
    • 发布 CloudRobo,全球首个全流程具身智能开发平台,打通数据生产、评测、训练、仿真到真机部署全链路。
    • 支持 PB 级并行处理及跨本体映射,拥有业界首个全国产 Real-Sim 数据生产体系。
    • 采用“乐高式”可插拔模型引擎,基于此打造的双系统 VLA 主动预测力控能力达行业 SOTA。
    • 举办首届具身智能大赛,以赛代练推动行业进步。
  • 科学计算专区(AI4S)
    • 面向生命科学、材料化学等硬核领域,打包华为天筹求解器、盘古预测大模型及合作伙伴成果。
    • 通过 API 统一开放,加速科学发现,已聚集 20 多所顶级院校及 5 家模型企业。
  • 智能制造专区
    • 提供全场景多模态数据融合、工业本体建模及工业增强知识图谱三大能力。
    • 使 AI 从“外挂”变为产线上的“原住民”,沉淀行业知识。

5. 标准与生态

  • 《先进公共云》白皮书:华为云联合罗兰贝格发布,定义公共云六大核心特征(全面普惠、集约高效、融合赋能、智能泛在、安全可控、国际引领)及三级评估体系。
  • 《企业如何构建面向智能体的混合云》白皮书:提供从架构选型到数据、安全、运维的落地指南。
  • 华为云 Stack 案例
    • 国家统计局:支撑五经普数据采集,实现毫秒级响应,同时在线用户超 30 万。
    • 中铝集团:打造坤安大模型,实现铝电解生产智能预测,单系列年省 8500 多万元。
    • 巴基斯坦:为 450 多所高校、400 万学生提供数字教育支持。

关键要点

  • 基础设施代际跃迁:华为云将云的角色从“应用的底座”升级为“智能体的底座”,强调让 Agent 算得快、记得住、调得动、跑得安全、学得会。
  • 四大新基建直击痛点
    • 算力:AICS 灵衢智算集群实现 10ms 低时延和 200 EFLOPS 算力。
    • 记忆:AMS Agentic 记忆存储提供 PB 级空间,缓存命中率 95%。
    • 调度:CCE Volcano Next 提升资源利用率 30%。
    • 安全:AgentSphere 实现 100ms 级沙箱启动,保障自主操作安全
查看原文 →qbitai.com