← 返回信息流
创投信息钛媒体·3 天前

中国AI算力需求爆发,云厂商涨价应对指数级增长

原标题:China Is Building a “Computing Power High-Speed Rail”

速览

2026年3月,腾讯、阿里等云厂商AI服务价格大幅上涨,背后是中国AI算力需求在两年内增长超千倍的现实。随着AI应用从简单问答转向Agent自主执行任务,单次请求的Token消耗量激增,导致算力成本急剧上升。面对供不应求的市场,云厂商通过涨价来平衡供需,反映出AI基础设施投入与算力瓶颈的矛盾。

AI 深度解读

中国正在构建“算力高铁”:AI 成本飙升背后的基础设施革命

背景

人工智能(AI)行业正经历一场剧烈的成本重构。2026年3月,AI 服务的定价逻辑发生了根本性变化。腾讯云部分 AI 模型价格涨幅超过 400%,阿里云在其“百炼”平台上对特定模型的服务价格也在单月内多次上调。

这种涨价并非孤立事件,而是供需失衡的集中体现。以内容创作者为例,使用 API 调用大模型批量生成一周短视频脚本(约 50 条),三个月前的 Token 计费成本约为 15 元人民币,而在 2026 年 3 月多家 AI 中转站关闭及云厂商集体涨价后,同等工作量成本飙升至近 60 元。

数据直观地反映了需求的爆炸式增长。2024 年初,中国日均 Token 调用量平均为 1000 亿;到了 2026 年 3 月,这一数字已激增至 140 万亿。短短两年间,算力消耗增长了超过 1000 倍。这种指数级的增长迫使市场重新审视 AI 基础设施的供给能力。

核心内容

1. 从“问答”到“执行”:算力消耗的质变

要理解算力成本飙升,首先需厘清“Token”的概念。Token 是 AI 处理信息的基本单位,也是计费单位。例如,询问“深圳今天天气如何”涉及约 200 个 Token,而要求 DeepSeek 撰写一份 5000 字的项目计划则需 8000 至 10000 个 Token。

过去,用户与 AI 的交互多为简单的问答,消耗极少。如今,使用场景已转变为“让 AI 做事”。例如,要求 AI 规划包含机票、酒店、路线和美食的五日游,这属于行业所称的 Agent(智能体) 任务。Agent 需要多轮推理、调用多个工具并逐步执行,单次任务消耗的 Token 量是普通问答的 100 到 1000 倍。从简单的 Q&A 到复杂的执行任务,算力消耗相差三个数量级。

2. 供给端的瓶颈与成本推手

面对激增的需求,供给端虽大幅投入,但仍显捉襟见肘。2024 年至 2025 年,字节跳动、阿里巴巴、腾讯等头部云厂商在核心 AI 芯片组件上的支出从 220 亿美元激增至 520 亿美元,翻倍有余。

硬件成本结构也在恶化:高带宽内存(HBM)在 GPU 物料清单(BOM)中的占比从约 50% 上升至三分之二。芯片昂贵、内存昂贵、电力昂贵,共同推高了整体计算成本。摩根大通预测,到 2030 年,中国 AI 推理 Token 消费量将是 2025 年的 370 倍;高盛预测同期全球 Token 消费量将增长 24 倍。涨价并非厂商的主观选择,而是产能无法跟上强劲需求的必然结果。

3. 算力黑洞:被忽视的广泛应用场景

公众往往误以为 AI 算力主要消耗于互联网内容生成,实则不然。制造业、医疗、科研等领域的算力消耗更为巨大且基础:

  • 制造业:富士康、宁德时代等企业利用 AI 进行视觉质检,全天候生产线每天需处理数百万张产品图像。
  • 程序员:通义灵码(Tongyi Lingma)和 GitHub Copilot 等工具辅助数百万中国开发者日常编码,每一次请求都消耗算力。
  • 内容产业:大量短视频文案、脚本及商品描述由 AI 生成。
  • 医疗健康:AI 辅助读取 CT 片,早期肺癌检测准确率已接近或超越人类医生。
  • 科学研究:AI 加速药物发现,将靶点识别到分子筛选的时间从数年压缩至更短周期。
  • 农业:卫星遥感结合 AI 分析,精准指导施肥和杀虫。

这些场景不仅消耗海量算力,更关乎产品质量、公众健康及粮食安全。当算力短缺时,成本压力将沿产业链传导,最终影响每一个普通人。

4. 中国的解决方案:“算力高铁”网络

类比 2010 年左右移动通信的发展——智能手机普及导致基站不足、数据昂贵,直到 4G/5G 大规模建设后才降低成本——AI 正处于同样的转折点。中国正在构建的“AI 基站”,即一体化算力网络

该网络被纳入“十五五”规划重点建设的“六张网”之一(包括水网、新一代电网、算力网、新一代通信网、城市地下管网和物流网)。其逻辑与 20 年前建设高铁和 4G 网络相同:国家先行投资基础设施,降低全社会的使用门槛和成本。

“东数西算”的调度逻辑: 中国规划了八大国家算力枢纽节点。

  • 东部节点(京津冀、长三角、粤港澳大湾区、成渝):用户集中,需毫秒级响应,主要承载对实时性要求高的 AI 推理工作负载。
  • 西部节点(内蒙古、贵州、甘肃、宁夏):绿电便宜、土地广阔,主要承载对时间不敏感的 AI 训练工作负载。

这种调度并非概念,已在运行。例如,浙江与新疆利用时差进行削峰填谷,使单 Token 电力成本降低 18%;西部绿色数据中心的 PUE(电源使用效率)可降至 1.15 以下,远低于全国平均水平。

关键要点

  • 算力需求爆炸:2024 年至 2026 年,中国日均 AI Token 调用量增长超 1000 倍,从 1000 亿激增至 140 万亿。
  • 应用场景升级:AI 使用方式从简单的“问答”转向复杂的“执行”(Agent),单次任务算力消耗增加 100-1000 倍。
  • 成本结构变化:头部云厂商 AI 芯片支出两年翻倍,HBM 内存占比大幅提升,导致硬件和电力成本全面上涨。
  • 行业影响深远:算力短缺不仅影响互联网内容,更深刻影响制造业质检、医疗诊断、药物研发及农业精准作业等实体经济领域。
  • 基础设施战略:中国将算力网络视为 AI 时代的“电力网”,通过“东数西算”工程优化资源配置,东部处理实时推理,西部利用廉价绿电进行训练。
  • 降本增效已见成效:通过跨地域调度(如浙新联动),单 Token 电力成本已降低 18%,西部数据中心 PUE 优化至 1.15 以下。

意义与影响

1. 算力成为新时代的“电力” 正如百年前工厂从自建发电机转向接入国家电网,AI 时代企业将从自建 GPU 集群转向按需购买算力。一体化算力网络将消除自建数据中心的低效和高成本,使算力像水电一样即插即用,大幅降低社会整体的数字化门槛。

2. 推动 AI 从“概念”走向“实体” 通过降低算力成本,中国正在解决 AI 在制造业、医疗、农业等实体产业落地难、成本高的问题。这使得 AI 不再仅仅是科技巨头的游戏,而是成为提升全要素生产率、保障粮食安全、提高医疗水平的公共基础设施。

3. 重塑全球 AI 竞争格局 面对全球范围内 AI 算力消耗的指数级增长,中国通过国家层面的基础设施统筹,试图走出一条不同于单纯依靠市场调节的路径。这种“新型举国体制”下的算力网络建设,旨在通过规模效应和能源优势,抵消硬件成本上升的压力,为 AI 应用的广泛普及提供可持续的动力。

4. 绿色计算的典范 “东数西算”不仅解决了算力分布不均的问题,更实现了能源的高效利用。将高耗能训练任务转移至绿电丰富的西部,并优化数据中心能效,体现了中国在追求数字经济增长的同时,对碳中和目标的践行。

查看原文 →tmtpost.com