黄仁勋GTC 2026发布AI PC及Vera Rubin,描绘十年计算蓝图
速览
黄仁勋在GTC 2026演讲中发布多项重磅产品,包括与微软合作的RTX Spark AI PC、专为Agent设计的Vera Rubin超级计算机系统以及开源大模型Nemotron 3 Ultra。RTX Spark通过本地运行Agent和统一内存架构,重新定义个人计算体验,实现从“操作软件”到“自然语言交互”的转变。Vera Rubin则提供从推理到协调的完整AI工厂能力,标志着英伟达对未来十年计算模式的完整判断。
AI 深度解读
背景
在 GTC 2026 大会上,英伟达(NVIDIA)CEO 黄仁勋发表了一场被视为 AI 时代“时间就是金钱”宣言的演讲。他提出了一个核心观点:“计算就是收入、瓦特就是收入、每一个 token 都是收入!”这一论断不仅定义了 AI 时代的经济逻辑,也揭示了英伟达对未来十年计算模式的完整判断。
随着 AI 从单纯的生成式应用向复杂的 Agent(智能体)时代演进,算力需求、能源效率以及软件交互方式正在发生根本性变革。黄仁勋通过展示一系列新产品和生态系统,旨在说明英伟达如何从一家 GPU 公司转型为系统公司,进而成为基础设施级的 AI 工厂构建者。本次大会的核心在于解决 Agent 时代的算力瓶颈、本地化部署难题以及大规模 AI 基础设施的能效与成本问题。
核心内容
黄仁勋在演讲中重点介绍了四大板块的创新,它们共同构成了英伟达应对未来十年挑战的战略拼图:重新定义的 AI PC、面向 Agent 的 Vera Rubin 超级计算机系统、开源大模型 Nemotron 3 Ultra 以及物理 AI Cosmos 3。
1. 重新定义 AI PC:RTX Spark 与 Windows 的深度整合
黄仁勋宣布微软与英伟达联手重新定义 AI PC,推出了基于 Blackwell RTX GPU 的笔记本电脑 RTX Spark。
- 硬件规格:RTX Spark 搭载联发科与英伟达联合设计的 N1X 芯片,集成 6144 个 CUDA 核心的 Blackwell RTX GPU、第五代 Tensor Core(支持 FP4 精度)以及定制的 20 核 Grace CPU。该芯片采用台积电 3nm 工艺,拥有 700 亿个晶体管,配备 128GB 统一内存,通过 NVLink-C2C 互联。
- 本地 Agent 能力:与传统笔记本不同,RTX Spark 旨在本地运行 AI Agent。这些 Agent 能够理解指令、读取屏幕和文件,并直接操作软件完成任务。黄仁勋演示了一个 Agent 在本地运行 Open Shell 沙盒,结合云端 Claude Sonnet,自动使用 Rhino 和 Blender 完成房屋设计建模、渲染的全过程。
- 微软 Windows 的优化:微软为 RTX Spark 进行了深度平台优化,包括工作负载配置文件调度、电源和热管理框架,以及统一内存管理。新的 Windows 安全原语与英伟达 OpenShell 运行时结合,解决了 Agent 在用户主力电脑上安全、私密运行的问题,支持身份隔离、策略控制和隐私保护。
- 生态与发布:ASUS、Dell、HP、Lenovo、微软 Surface 和 MSI 等厂商将于今年秋季推出基于 RTX Spark 的超薄笔记本和紧凑型台式 PC。此外,英伟达还推出了桌面和工作站版本 DGX Spark,拥有 768GB 内存和 20 petaflops 算力,支持本地训练和测试万亿参数大模型。
2. AI 工厂与 Vera Rubin 系统
黄仁勋宣布 Vera Rubin 已全面投入生产,这是一套五机架规模的 AI 超级计算机系统,专为运行复杂的 Agent 工作流而设计。
- 系统架构:Vera Rubin 由七颗新芯片组成,采用台积电 3nm 制程和 CoWoS-L 封装技术。系统包含五种机架:
- Vera Rubin NVL72:Agent 的“大脑”,负责提示理解、上下文处理、推理和规划。
- Vera CPU 机架:包含 256 颗 Vera CPU,负责协调模型、管理内存和调用工具。
- Groq 3 LPX 机架:提供超低延迟的 Token 生成,每秒 40PB 的 SRAM 带宽。
- Vera BlueField-4 STX 存储机架:负责 Agent 的记忆存储、处理加速和片上安全。
- NVIDIA Spectrum-X Ethernet CPO 网络机架:采用共封装光学技术(CPO),提供 200Gb/s SerDes 带宽。
- 共封装光学(CPO)技术:这是世界上首个基于 CPO 技术的交换机。相比传统可插拔收发器,CPO 将光学模块直接封装在芯片上,带来能效提升 5 倍、AI 正常运行时间延长 5 倍、部署时间缩短三分之一的优势。
- 安全与运营(DSX 平台):
- BlueField-4 DPU:提供高达 800Gb/s 的软件定义网络和内置多租户隔离,支持机密计算和零信任策略执行。
- DSX 平台:英伟达的设计与运营基础设施蓝图,包含 DSX Sim(数字孪生验证)、DSX OS(运营监控)和 DSX Max-Q(动态电力分配与冷却优化)。DSX 旨在帮助客户以最低 Token 成本构建和运营高能效 AI 工厂。
- 供应链与制造:Vera Rubin 的组装时间从 Grace Blackwell 时代的 2 小时缩短至 5 分钟,采用全液冷、模块化设计。CoreWeave、Lambda 和 Oracle Cloud Infrastructure 是首批采用 CPO 网络的合作伙伴。
3. 开源大模型 Nemotron 3 Ultra
英伟达发布了专为 Agent 工作负载设计的开源大模型 Nemotron 3 Ultra。
- 完全开源:不仅开源模型权重,还开源了训练脚本和数据集,允许开发者在此基础上继续训练和优化。
- 架构优势:采用混合架构,结合状态空间模型(SSM)与专家混合(MoE)。
- 性能提升:推理速度比前代快近五倍,运行成本降低约 30%。
- 应用场景:针对长时程推理、工具使用和任务解决进行了优化。黄仁勋展示了英伟达利用 Nemotron 作为“技术大脑”,结合 Cadence 工具栈和 Open Shell 安全沙箱,构建“芯片设计 AI 助手团队”,自动完成 RTL 代码编写、仿真验证和 Bug 修复,大幅缩短芯片验证周期。
4. 物理 AI 与 Cosmos 3
除了上述重点,黄仁勋还展示了物理 AI 平台 Cosmos 3 以及基于此诞生的参考人形机器人 Isaac。这标志着英伟达在模拟现实世界物理规律并应用于机器人训练方面的进一步深入。
关键要点
- 经济逻辑转变:AI 时代的竞争核心在于效率,即每瓦特产生的 Token 数量和每单位计算产生的收入。计算、能源和 Token 生成效率直接挂钩利润。
- AI PC 范式转移:个人电脑正从“启动应用、点击输入”的工具转变为“直接对话、Agent 自动执行”的智能助手。RTX Spark 通过本地运行大模型和 Agent,实现了隐私、低延迟和高性能的统一。
- Agent 驱动的基础设施:Vera Rubin 系统专为处理 Agent 的复杂工作流(观察、推理、规划、工具使用、记忆管理)而设计,解决了高吞吐与低延迟并存的难题。
- 基础设施规模化:英伟达已转型为提供完整 AI 工厂解决方案的公司。DSX 平台和共封装光学(CPO)技术旨在解决大规模数据中心在电力、冷却、网络和安全方面的瓶颈,降低 Token 成本。
- 开源生态战略:Nemotron 3 Ultra 的完全开源(模型+数据+脚本)旨在建立行业标准,吸引开发者基于英伟达生态构建应用,同时通过提供最佳实践(如芯片设计自动化)展示其实际价值。
- 安全与信任:随着 Agent 深入企业核心业务,英伟达通过 Windows 安全原语、OpenShell 沙箱、BlueField-4 DPU 和机密计算技术,构建了从端侧到云端的端到端安全体系,确保 Agent 在可控、隔离的环境中运行。
意义与影响
黄仁勋的演讲清晰地勾勒出英伟达在未来十年的战略路径:从提供单一硬件组件,转向提供涵盖芯片、系统、软件、网络及安全的全栈基础设施解决方案
