华为云周跃峰:不打Token价格战,以Agentic Infra卖生产力
速览
华为云CEO周跃峰在2026华为云INSPIRE创想者大会上明确战略重心,不再以Token总量或收入规模为KPI,而是聚焦于提升生产力。华为云推出Agentic Infra新范式及四大行业专区,依托全国产化算力软硬件和开源生态,为政企客户提供差异化AI服务。此举旨在避开激烈的Token价格红海,押注智能体真正进入产业后的底层基础设施市场。
AI 深度解读
华为云战略重构:从“Token规模”到“生产力实效”的深度解读
背景
当前中国 AI 云市场正处于激烈的竞争与叙事重塑期。过去半年,以阿里云和火山引擎为代表的头部云厂商,以及月之暗面、DeepSeek、智谱等大模型厂商,普遍将日均 Token 调用量、MaaS(模型即服务)收入规模作为新的增长锚点。行业关键词高度聚焦于模型调用量和规模扩张,推理价格被不断压低,形成了一场以“Token 价格战”为核心的红海竞争。
在此背景下,华为公司在 2026 年 6 月 5 日举办的 2026 华为云 INSPIRE 创想者大会上,由华为公司董事、华为云 CEO 周跃峰首次公开阐述其战略重心。周跃峰明确表示:“我不太在乎 Token 总量是多少,也不太在乎收入总量是多少。”这一表态在当下强调规模效应的 AI 云市场中显得尤为罕见。华为云选择从“AI 云第二名之争”中抽身,转而通过发布一系列面向 AI 密集场景的新品,提出“Agentic Infra”新范式,试图定义一种不同于传统云厂商的竞争逻辑。
核心内容
华为云的战略调整并非简单的产品迭代,而是基于其独特的算力路线、商业重心和生态打法进行的系统性重构。周跃峰指出,华为云与其他云厂商的差异主要体现在以下三个维度:
1. 算力路线:构建全国产化的“第二个算力平面” 华为云坚持使用全国产化算力软硬件体系,包括昇腾(Ascend)、鲲鹏(Kunpeng)、CANN(Compute Architecture for Neural Networks)以及欧拉(openEuler)操作系统。由于无法依赖 NVIDIA 等外部主流算力,华为必须将国产化打造为产业级答案。周跃峰强调,华为不愿意在“万国牌”硬件规模上与友商对账,也不参与收入排名的比较。其目标是为全球主导的 NVIDIA+主流公有云路径之外,提供另一种生态选择,即构建“第二个算力平面”。
2. 商业重心:聚焦政企与国计民生行业 不同于互联网系云厂商依赖 C 端流量和开发者生态,华为云的重兵部署在政府、金融、央国企等政企领域。华为混合云已连续多年在这些市场份额第一,服务全球 5500 多家客户。针对政企客户数据主权与算力迭代速度之间的矛盾,周跃峰建议客户不要自建万卡集群,而是采用“本地数据 + 远端公有云 AI 算力/模型服务”的混合云模式,配合机密推理、机密训练、机密计算等技术,平衡数据主权与算力共享,将公有云的迭代红利输送给无法完全上公有云的客户。
3. 生态打法:彻底的开源与广泛的模型合作 华为云在开源方面投入巨大,昇腾 CANN、欧拉操作系统、CCE Volcano 调度引擎、ModelArts 工具链均已开源。其智能体平台 AgentArts 的开源版 openJiuwen 内核与商业版同源度超过 90%。此外,华为云联合智谱、DeepSeek、MiniMax、Kimi、阶跃星辰、百度、美团 LongCat、讯飞星火等 20 余家头部模型厂商发起“百模千态,云聚共赢”计划,旨在通过扩大生态和模型选择,在国产化算力供给受限的窗口期站稳脚跟。
战略落地:Agentic Infra 新范式 周跃峰判断,AI 产业演进已从“买算力卡”、“练大模型”进入“用智能体”阶段。华为云据此重排产品矩阵,提出“Agentic Infra”概念,包含四大核心组件:
- AICS 灵衢智算集群:将 10 万卡集群的 Token 时延压至 10 毫秒以内,打造高效 Token 工厂。
- AMS Agentic 记忆存储:通过 NPU 直通 CMS 技术实现 PB 级记忆空间,解决 Agent 长程任务记忆瓶颈。
- CCE Volcano Next 通智一体化调度引擎:通过训推共池提升资源利用率 30% 以上。
- AgentSphere 安全自治运行底座:利用羽量级沙箱实现 100 毫秒级启动和每分钟十万级批创。
同时,华为云重构了 ModelArts Next 的 MaaS 玩法,支持成本优先、效果优先、均衡三种模型路由策略,接入 15 余款 SOTA 模型,调度精准率超 95%,平均降低调用成本 20%。
行业专区:从卖 Token 到卖生产力 华为云一次性上线了智慧医疗、具身智能、智能制造、科学计算四大“行业 AI 梦工厂”专区。
- 智慧医疗:联合上海瑞金医院共建 RuiPath 大模型,推动病理诊断等专家经验能力向县域医院规模化输出。
- 具身智能:推出全球首个全流程具身智能开发平台 CloudRobo,服务于中国 300 多家具身智能创业公司。
周跃峰强调,在医疗和金融等数字化成熟行业,衡量 AI 价值的尺度应是风险防范比例、信贷效率提升或诊断准确率,而非日活或 Token 数。华为云的战略轮廓清晰可见:以全国产算力+开源生态为底座,以混合云+机密计算覆盖政企,以 Agentic Infra+行业专区将竞争焦点从“卖 Token”转移到“卖生产力”。
关键要点
- 战略定力:华为云明确拒绝参与 Token 规模和收入排名的比较,KPI 定义为“每一个 Token 背后是否真正提升了生产力”。
- 差异化算力:依托昇腾、鲲鹏、CANN、欧拉等自研体系,构建独立于 NVIDIA 生态之外的“第二个算力平面”,解决国产化算力供给受限问题。
- 政企优先:商业重心聚焦政府、金融、央国企,通过混合云和机密计算技术解决数据主权与算力迭代之间的矛盾。
- 开源生态:核心组件全面开源,联合 20 余家头部模型厂商,通过扩大模型选择来弥补单一算力生态的不足。
- Agentic Infra 架构:发布 AICS、AMS、CCE Volcano Next、AgentSphere 四大组件,解决智能体部署中的时延、记忆、调度和安全难题。
- 行业垂直化:通过智慧医疗、具身智能等行业专区,将 AI 能力转化为具体的行业生产力指标(如诊断准确率、信贷效率),而非通用的流量指标。
- 长期主义:承认该战略路径比追逐 MaaS 收入更慢、更难讲出漂亮的同比数据,但旨在押注智能体进入产业后的底层基础设施位置,避开价格红海。
意义与影响
华为云的这一战略转向,标志着中国 AI 云市场从“规模扩张期”进入“价值深耕期”的分水岭。
首先,重新定义了 AI 云的竞争维度。在行业普遍陷入 Token 价格战的当下,华为云提出“卖生产力”而非“卖 Token”,为政企客户提供了更具务实意义的评估标准。这不仅有助于缓解行业内的恶性价格竞争,也引导客户关注 AI 在实际业务场景中的落地效果,如金融风控、医疗诊断等具体指标的改善。
其次,强化了国产化算力的产业独立性。通过构建“第二个算力平面”,华为云在 NVIDIA 主导的全球算力格局中,为中国产业 AI 提供了一条自主可控的技术路径。尽管这条路更曲折,但在地缘政治和供应链安全的背景下,这种独立性具有极高的战略价值。
最后,推动了 AI 从技术演示向产业应用的深化。通过 Agentic Infra 和行业专区,华为云将 AI 能力深入到具身智能、智慧医疗等垂直领域,加速了智能体(Agent)在企业级场景中的工程化落地。这种“慢但难”的路径,虽然短期内难以在财务数据上体现爆发式增长,但有望在长期内建立起基于真实生产力提升的护城河,为中国产业 AI 的未来需求提供坚实的底层基础设施支撑。
