← 返回信息流
AI 资讯爱范儿·3 天前

英伟达发布RTX Spark,联手微软重塑Windows AI PC

原标题:英伟达掀桌,Windows 终于迎来真 AI PC

速览

英伟达在COMPUTEX 2026上发布RTX Spark处理器,旨在将数据中心级AI能力引入个人电脑。该产品搭载Blackwell GPU与联发科定制CPU,支持本地运行大型语言模型及智能体应用。此举标志着Windows PC从传统应用入口向个人AI超级计算机转型,开启Agentic AI新纪元。

AI 深度解读

背景

Windows PC 市场在过去四十年中保持着相对稳定的分工格局:微软主导操作系统与软件入口,Intel 与 AMD 把控 x86 处理器平台,而英伟达(NVIDIA)则从图形计算起步,逐步将 AI 加速推向核心地位。然而,随着 AI 技术的演进,这一传统格局正面临重塑。

在刚刚结束的 2026 年 COMPUTEX 主题演讲上,英伟达 CEO 黄仁勋展示了公司沿着 AI 基础设施主线向更多产业核心环节渗透的战略。除了常规的 GPU、AI 工厂和物理 AI 话题外,此次发布会的重头戏是被称为“PC 新时代”(A new era of PC)的 RTX Spark 处理器。这一系列动作背后的核心关键词只有一个:Agent(智能体)。英伟达正联手微软,试图将个人电脑从传统的应用程序入口,重新定义为原生运行智能体的个人 AI 平台。

核心内容

1. RTX Spark:重新定义 AI PC 的核心硬件

英伟达推出的 RTX Spark 处理器是这一新 PC 体系的核心。其硬件规格旨在打破传统 PC 的算力瓶颈:

  • GPU 部分:搭载 Blackwell RTX GPU,FP4 AI 性能达到 1 petaflop。
  • CPU 部分:与联发科(MediaTek)合作定制的 20 核 Grace CPU。
  • 内存与互联:配备 128 GB 统一内存,并通过 NVLink C2C 提供 600 GB/s 的带宽。
  • 软件栈:完整支持 CUDA、TensorRT、NVFP4、RTX Ray Tracing、DLSS、Reflex 和 G-SYNC。

在产品形态上,RTX Spark 被封装在更接近主流 Windows PC 的尺寸中,笔记本厚度仅 14 毫米,重量约 3 磅,覆盖 14 至 16 英寸机型,采用铝合金机身和 tandem OLED 屏幕。其目标场景不仅是端侧语音助手或轻量办公,而是将数据中心级别的 AI 能力、游戏图形能力和专业创作能力集成到个人电脑中。

黄仁勋强调,这台电脑要运行“所有东西”:传统 Windows 应用、CUDA 软件栈、图形工作流以及各类 AI 应用(如数字生物、地震处理等)。演示中,智能体能够调用 Rhino 进行建筑设计,并结合 Blender 和 Flux 2 生成渲染图,展示了从手动操作软件向“智能体围绕目标调度工具”的转变。Adobe Photoshop、Premiere 等应用正在为 RTX Spark 优化,并通过 MCP(Model Context Protocol)接入本地智能体。

RTX Spark 产品线包含三种形态:

  • 笔记本:面向移动办公、游戏和创作,可本地运行 Nemotron 3 Ultra 或连接云端模型。
  • 台式机:作为家庭个人 AI 主机,24 小时运行智能体,连接各类智能家居设备。
  • 工作站(DGX Station for Windows):面向模型和智能体开发者,配备 748 GB 内存、20 petaflops 算力和 8 TB/s 内存带宽,可在桌面运行万亿参数模型。

2. Agentic AI:从“有用 AI”到智能体工作流

行业正从“有用 AI”(useful AI)阶段进入 Agentic AI 时代,软件开发是首批应用场景。黄仁勋指出,AI 提高了工程师产出,反而促进了就业增长。

在应用形态上,智能体时代的计算流程发生了根本变化:用户给出目标 -> 模型理解意图 -> 运行环境调度流程 -> 工具执行任务 -> 记忆系统保存上下文 -> 产出结果。这一过程包含观察、理解、推理、规划、行动和工具调用。在此框架下,LLM 仅是“思考模块”,完整的智能体还需要 harness(调度编排层)、工具(浏览器、数据库、CAD 等)以及记忆系统。

3. Vera Rubin 与 Vera CPU:面向智能体的基础设施

为支撑智能体从输入到执行的完整流程,英伟达发布了下一代 AI 超级芯片平台 Vera Rubin 和专用的 Vera CPU。

  • Vera Rubin 平台:已进入全面投产阶段,是面向 Agentic AI 设计的 AI 工厂核心系统。它由 Rubin GPU、Vera CPU、NVLink 72、BlueField、ConnectX 9 等组成,旨在支撑大规模智能体负载。其中,Rubin GPU 负责主要计算,Vera CPU 负责调度和数据管线。
  • Vera CPU 设计逻辑:传统 CPU 服务于人类用户,响应以秒为单位;而智能体频繁调用工具和访问数据,要求极低延迟。Vera CPU 采用自研 Olympus Core,重点优化单线程性能、核心间带宽和能效。它包含 88 个 Olympus 核心,采用单片网格结构以减少跨芯片通信延迟。相比 x86 CPU,Vera 在部分场景中峰值内存延迟降低 40%,智能体 sandbox 性能提升 1.8 倍,SQL 性能提升 3 倍。

4. AI 工厂与企业智能体生态

黄仁勋指出,AI 的商业逻辑已变,token 成为产生收入的单位,算力即生产能力。

  • NVIDIA DSX:作为构建和运营 AI 工厂的蓝图与参考设计,基于 Omniverse 进行数字孪生模拟,涵盖电力、冷却、网络等基础设施。未来 1 GW 级 AI 工厂的投资可能高达 1000 亿美元。
  • 企业智能体能力:英伟达将企业构建智能体的能力分为四类,对应产品为 Nemotron(模型)、OpenShelf(调度系统)、CUDA X libraries(工具与技能)和 AI 平台(运行环境)。
  • Nemotron 3 Ultra:新发布的开放模型,采用 SSM 状态空间模型与 MoE 混合专家架构,相比 Kimi K2.6、Qwen 3.5 等模型,速度提升 5 倍,运行成本降低约 30%。

关键要点

  • PC 定位重构:Windows PC 正从传统应用入口转变为原生运行智能体的个人 AI 平台,RTX Spark 是这一转变的核心硬件载体。
  • 硬件规格突破:RTX Spark 搭载 Blackwell RTX GPU 和联发科定制 Grace CPU,具备 1 petaflop FP4 性能,旨在将数据中心级 AI 能力下放至个人电脑。
  • 智能体工作流:应用形态从“人操作软件”转向“智能体调度工具”,LLM 作为思考模块,结合 harness、工具和记忆系统构成完整智能体。
  • 专用 CPU 架构:Vera CPU 专为智能体设计,通过单片网格结构和 Olympus Core 优化低延迟和高吞吐,解决智能体频繁调用工具时的瓶颈。
  • AI 工厂商业化:NVIDIA DSX 提供 AI 工厂基础设施蓝图,强调 token 作为收入单位的商业逻辑,推动算力从成本中心转变为生产中心。
  • 全场景覆盖:英伟达的战略覆盖个人设备(RTX Spark)、数据中心(Vera Rubin)、企业软件(Nemotron/OpenShelf)、自动驾驶(Alpamayo/Hyperion)及机器人(Isaac Groot),形成完整的 AI 基础设施体系。

意义与影响

英伟达在 2026 年 COMPUTEX 上的发布,标志着其身份从单纯的 GPU 供应商、系统公司,进一步向 AI 基础设施公司转型。黄仁勋通过这场演讲清晰地传达了一个信号:AI 竞争已不再局限于模型本身,而是扩展到覆盖个人电脑、企业软件、数据中心和物理设备的整套计算体系。

对于消费者而言,未来的 Windows 电脑将具备运行复杂智能体的能力,成为家庭和个人工作流中的“AI 超级计算机”。对于开发者和企业,RTX Spark 提供了除 Mac 之外,在本地运行大语言模型(LLM)和处理高负载 AI 任务的新选项。对于整个行业,Vera Rubin 和 Vera CPU 的推出,确立了智能体时代的基础设施标准,即通过专用硬件优化低延迟和高并发,以支撑 Agentic AI 的大规模落地。英伟达正试图通过定义这一整套计算模式,牢牢占据 AI 时代

查看原文 →ifanr.com