AI 资讯爱范儿·3 天前

英伟达发布RTX Spark，联手微软重塑Windows AI PC

原标题：英伟达掀桌，Windows 终于迎来真 AI PC

速览

英伟达在COMPUTEX 2026上发布RTX Spark处理器，旨在将数据中心级AI能力引入个人电脑。该产品搭载Blackwell GPU与联发科定制CPU，支持本地运行大型语言模型及智能体应用。此举标志着Windows PC从传统应用入口向个人AI超级计算机转型，开启Agentic AI新纪元。

AI 深度解读

背景

Windows PC 市场在过去四十年中保持着相对稳定的分工格局：微软主导操作系统与软件入口，Intel 与 AMD 把控 x86 处理器平台，而英伟达（NVIDIA）则从图形计算起步，逐步将 AI 加速推向核心地位。然而，随着 AI 技术的演进，这一传统格局正面临重塑。

在刚刚结束的 2026 年 COMPUTEX 主题演讲上，英伟达 CEO 黄仁勋展示了公司沿着 AI 基础设施主线向更多产业核心环节渗透的战略。除了常规的 GPU、AI 工厂和物理 AI 话题外，此次发布会的重头戏是被称为“PC 新时代”（A new era of PC）的 RTX Spark 处理器。这一系列动作背后的核心关键词只有一个：Agent（智能体）。英伟达正联手微软，试图将个人电脑从传统的应用程序入口，重新定义为原生运行智能体的个人 AI 平台。

核心内容

1. RTX Spark：重新定义 AI PC 的核心硬件

英伟达推出的 RTX Spark 处理器是这一新 PC 体系的核心。其硬件规格旨在打破传统 PC 的算力瓶颈：

GPU 部分：搭载 Blackwell RTX GPU，FP4 AI 性能达到 1 petaflop。
CPU 部分：与联发科（MediaTek）合作定制的 20 核 Grace CPU。
内存与互联：配备 128 GB 统一内存，并通过 NVLink C2C 提供 600 GB/s 的带宽。
软件栈：完整支持 CUDA、TensorRT、NVFP4、RTX Ray Tracing、DLSS、Reflex 和 G-SYNC。

在产品形态上，RTX Spark 被封装在更接近主流 Windows PC 的尺寸中，笔记本厚度仅 14 毫米，重量约 3 磅，覆盖 14 至 16 英寸机型，采用铝合金机身和 tandem OLED 屏幕。其目标场景不仅是端侧语音助手或轻量办公，而是将数据中心级别的 AI 能力、游戏图形能力和专业创作能力集成到个人电脑中。

黄仁勋强调，这台电脑要运行“所有东西”：传统 Windows 应用、CUDA 软件栈、图形工作流以及各类 AI 应用（如数字生物、地震处理等）。演示中，智能体能够调用 Rhino 进行建筑设计，并结合 Blender 和 Flux 2 生成渲染图，展示了从手动操作软件向“智能体围绕目标调度工具”的转变。Adobe Photoshop、Premiere 等应用正在为 RTX Spark 优化，并通过 MCP（Model Context Protocol）接入本地智能体。

RTX Spark 产品线包含三种形态：

笔记本：面向移动办公、游戏和创作，可本地运行 Nemotron 3 Ultra 或连接云端模型。
台式机：作为家庭个人 AI 主机，24 小时运行智能体，连接各类智能家居设备。
工作站（DGX Station for Windows）：面向模型和智能体开发者，配备 748 GB 内存、20 petaflops 算力和 8 TB/s 内存带宽，可在桌面运行万亿参数模型。

2. Agentic AI：从“有用 AI”到智能体工作流

行业正从“有用 AI”（useful AI）阶段进入 Agentic AI 时代，软件开发是首批应用场景。黄仁勋指出，AI 提高了工程师产出，反而促进了就业增长。

在应用形态上，智能体时代的计算流程发生了根本变化：用户给出目标 -> 模型理解意图 -> 运行环境调度流程 -> 工具执行任务 -> 记忆系统保存上下文 -> 产出结果。这一过程包含观察、理解、推理、规划、行动和工具调用。在此框架下，LLM 仅是“思考模块”，完整的智能体还需要 harness（调度编排层）、工具（浏览器、数据库、CAD 等）以及记忆系统。

3. Vera Rubin 与 Vera CPU：面向智能体的基础设施

为支撑智能体从输入到执行的完整流程，英伟达发布了下一代 AI 超级芯片平台 Vera Rubin 和专用的 Vera CPU。

Vera Rubin 平台：已进入全面投产阶段，是面向 Agentic AI 设计的 AI 工厂核心系统。它由 Rubin GPU、Vera CPU、NVLink 72、BlueField、ConnectX 9 等组成，旨在支撑大规模智能体负载。其中，Rubin GPU 负责主要计算，Vera CPU 负责调度和数据管线。
Vera CPU 设计逻辑：传统 CPU 服务于人类用户，响应以秒为单位；而智能体频繁调用工具和访问数据，要求极低延迟。Vera CPU 采用自研 Olympus Core，重点优化单线程性能、核心间带宽和能效。它包含 88 个 Olympus 核心，采用单片网格结构以减少跨芯片通信延迟。相比 x86 CPU，Vera 在部分场景中峰值内存延迟降低 40%，智能体 sandbox 性能提升 1.8 倍，SQL 性能提升 3 倍。

4. AI 工厂与企业智能体生态

黄仁勋指出，AI 的商业逻辑已变，token 成为产生收入的单位，算力即生产能力。

NVIDIA DSX：作为构建和运营 AI 工厂的蓝图与参考设计，基于 Omniverse 进行数字孪生模拟，涵盖电力、冷却、网络等基础设施。未来 1 GW 级 AI 工厂的投资可能高达 1000 亿美元。
企业智能体能力：英伟达将企业构建智能体的能力分为四类，对应产品为 Nemotron（模型）、OpenShelf（调度系统）、CUDA X libraries（工具与技能）和 AI 平台（运行环境）。
Nemotron 3 Ultra：新发布的开放模型，采用 SSM 状态空间模型与 MoE 混合专家架构，相比 Kimi K2.6、Qwen 3.5 等模型，速度提升 5 倍，运行成本降低约 30%。

关键要点

PC 定位重构：Windows PC 正从传统应用入口转变为原生运行智能体的个人 AI 平台，RTX Spark 是这一转变的核心硬件载体。
硬件规格突破：RTX Spark 搭载 Blackwell RTX GPU 和联发科定制 Grace CPU，具备 1 petaflop FP4 性能，旨在将数据中心级 AI 能力下放至个人电脑。
智能体工作流：应用形态从“人操作软件”转向“智能体调度工具”，LLM 作为思考模块，结合 harness、工具和记忆系统构成完整智能体。
专用 CPU 架构：Vera CPU 专为智能体设计，通过单片网格结构和 Olympus Core 优化低延迟和高吞吐，解决智能体频繁调用工具时的瓶颈。
AI 工厂商业化：NVIDIA DSX 提供 AI 工厂基础设施蓝图，强调 token 作为收入单位的商业逻辑，推动算力从成本中心转变为生产中心。
全场景覆盖：英伟达的战略覆盖个人设备（RTX Spark）、数据中心（Vera Rubin）、企业软件（Nemotron/OpenShelf）、自动驾驶（Alpamayo/Hyperion）及机器人（Isaac Groot），形成完整的 AI 基础设施体系。

意义与影响

英伟达在 2026 年 COMPUTEX 上的发布，标志着其身份从单纯的 GPU 供应商、系统公司，进一步向 AI 基础设施公司转型。黄仁勋通过这场演讲清晰地传达了一个信号：AI 竞争已不再局限于模型本身，而是扩展到覆盖个人电脑、企业软件、数据中心和物理设备的整套计算体系。

对于消费者而言，未来的 Windows 电脑将具备运行复杂智能体的能力，成为家庭和个人工作流中的“AI 超级计算机”。对于开发者和企业，RTX Spark 提供了除 Mac 之外，在本地运行大语言模型（LLM）和处理高负载 AI 任务的新选项。对于整个行业，Vera Rubin 和 Vera CPU 的推出，确立了智能体时代的基础设施标准，即通过专用硬件优化低延迟和高并发，以支撑 Agentic AI 的大规模落地。英伟达正试图通过定义这一整套计算模式，牢牢占据 AI 时代

查看原文 →ifanr.com