技术博客Google AI Blog·2026/5/19

Google I/O 2026：拥抱 Gemini 智能体时代

原标题：I/O 2026: Welcome to the agentic Gemini era

速览

Google 在 I/O 2026 大会上发布了关于 Gemini 的最新进展，重点介绍了智能体（Agentic）技术的演进。此次更新旨在通过更强大的 AI 能力，帮助用户更高效地完成各类任务。这标志着 Google 在 AI 产品化道路上迈出了重要一步，正式开启智能体驱动的新阶段。

AI 深度解读

I/O 2026：欢迎来到 Agentic Gemini 时代

背景

自上次 Google I/O 大会以来，已经过去了非凡的一年。这段时间见证了 Google 在技术推进和“超高速”迭代方面的不懈努力。当前，AI 发展周期已进入一个新阶段：用户不再仅仅关注技术本身，而是迫切希望在日常使用的产品中看到切实的价值。

Google CEO Sundar Pichai 在 I/O 2026 的演讲中指出，距离 Google 转向“AI-first”（AI 优先）战略已整整十年。Google 依然认为，AI 是深化其使命、大规模改善人们生活的最深刻方式。为此，Google 采取了一种差异化的全栈式 AI 创新方法：从定制硅芯片和安全的底层基础，到世界级的研究与模型，再到触及数十亿用户的最终产品与平台。这种全栈能力使得 Google 能够以更快的速度进行迭代和创新，并点亮了公司的每一个部分。

核心内容

全栈 AI 势头的量化证明

衡量 AI 进步的最佳指标是用户如何使用它，而衡量采用规模的一个关键代理指标是“Token”（模型处理的基本数据单位）。

Token 处理量的爆炸式增长：两年前，Google 各产品表面每月处理的 Token 数量为 9.7 万亿；去年 I/O 时增长至约 480 万亿；而截至目前，这一数字已跃升 7 倍，达到每月超过 32 万亿（3.2 quadrillion）。
开发者与企业参与度：
- 每月有超过 850 万名开发者正在使用 Google 的模型构建新应用和体验。
- Google 的模型 API 每分钟处理约 190 亿个 Token。
- 在过去 12 个月中，超过 375 家 Google Cloud 客户各自处理了超过 1 万亿个 Token，显示出各行业对 AI 的巨大需求。

产品势头的爆发

目前，Google 拥有 13 款月活跃用户（MAU）超过 10 亿的产品，其中 5 款的 MAU 超过 30 亿。Gemini 模型是推动用户增长和使用频率提升的核心动力。

Search（搜索）：
- AI Overviews：月活跃用户已超过 25 亿。
- AI Mode：这是 Search 历史上最大的升级，上线仅一年，MAU 已突破 10 亿。Search 正从单一的查询工具转变为持续的对话体验，提供更深入的洞察并连接更广阔的网络内容。
Gemini App：
- MAU 从去年的 4 亿增长至今天的超过 9 亿，一年内翻倍。
- 每日请求量增长了七倍以上。
- 新增功能如“Personal Intelligence”（个人智能）使响应更加定制化和有帮助。
- 基于 Nano Banana 图像生成模型，至今已生成超过 500 亿张图像，展现了巨大的潜在创造力。

产品中的自然对话式 AI

Google 正在将更自然的对话能力引入核心产品，以释放生产力潜力。

Maps（地图）：
- 迎来了十年来最大的升级，新增 Ask Maps 功能。用户现在可以提出更复杂、更长的自然语言问题。
YouTube：
- 推出 Ask YouTube 功能，彻底重构了搜索体验。它能根据用户兴趣匹配视频，并直接跳转到视频中最相关的片段，使信息更易消化和导航。
- 目前在美国开始测试，预计今年夏季广泛推出。
Docs（文档）：
- 推出 Docs Live 功能。得益于音频模型的技术飞跃，用户不再需要输入精确的提示词，而是可以通过语音进行“思维倾倒”（brain dump），由 Gemini 自动整理和生成文档。
- 该功能今年夏季面向订阅用户推出，随后强大的语音能力也将延伸至 Gmail 和 Keep。

支撑大规模创新的基础设施

为了支持如此规模的用户增长以及服务全球的企业和开发者，Google 在基础设施上进行了巨额投资。

资本支出（Capex）：2022 年年度资本支出为 310 亿美元，预计今年将达到之前的六倍左右，约为 1800 亿至 1900 亿美元。
定制硅芯片（TPU）：
- 自十年前发布首款商用 TPU 以来，Google 彻底改变了行业构建 AI 的方式。
- 在 Cloud Next 上发布了第 8 代 TPU，首次采用双芯片架构，分别针对训练和推理进行专门优化：TPU 8t 和 TPU 8i。
  - TPU 8t：专为大规模预训练优化，原始算力约为上一代的三倍。结合 JAX 和 Pathways，训练不再受限于单个大型数据中心，而是可以无缝分布在多个站点，全球可扩展至超过 100 万个 TPU，形成世界上最大的训练集群。这使得模型构建者能在数周内而非数月内训练更大、更强大的模型。
  - TPU 8i：专为推理设计。Google 深知“延迟至关重要”，因此在每一步都大幅提升了速度。
- 能效：两款芯片均提高了能源效率，每瓦特性能提升高达两倍。

Gemini Omni：迈向世界模型

TPU 的进步使得模型、编码和智能体（Agents）的计算能力得以突破。随着世界模型（World Models）的发展，AI 正从预测文本转向模拟现实。

Gemini Omni：这是一款新模型，能够从任何输入模态生成任何输出模态的样本。初期支持视频输出，未来将扩展至图像和文本。它结合了 Gemini 的智能与生成式媒体模型，在“世界理解”方面取得了巨大飞跃。
Gemini Omni Flash：Omni 系列的首款模型，即日起可用。用户可以在 Gemini App 中尝试该模型。

关键要点

Token 规模呈指数级增长：Google 每月处理的 Token 数量从两年前的 9.7 万亿飙升至目前的 32 万亿以上，反映了 AI 采用率的惊人速度。
开发者生态繁荣：每月有 850 万开发者利用 Google 模型构建应用，API 每分钟处理 190 亿 Token，显示出强大的 B 端需求。
核心产品全面 AI 化：
- Search 的 AI Mode 在一年内达到 10 亿 MAU，改变了搜索的交互范式。
- Gemini App 用户数突破 9 亿，图像生成量达 500 亿张。
交互方式向自然语言转变：Maps 的 Ask Maps、YouTube 的 Ask YouTube 以及 Docs 的 Docs Live，均强调通过自然对话和语音交互来提升效率和体验。
基础设施投资巨大：年度资本支出预计达 1800-1900 亿美元，重点投入定制硅芯片。
TPU 8 代双架构：推出专用于训练的 TPU 8t 和专用于推理的 TPU 8i，支持全球百万级 TPU 集群训练，显著提升训练速度和能效。
Gemini Omni 发布：首款多模态生成模型 Gemini Omni Flash 上线，标志着 AI 从文本预测向模拟现实（世界模型）迈进。

意义与影响

Google I/O 2026 的发布标志着 Google 正式进入“Agentic Gemini”（智能体 Gemini）时代。这不仅是产品功能的更新，更是 Google 全栈 AI 战略成熟度的集中体现。

首先，从“工具”到“伙伴”的转变。通过 Ask Maps、Ask YouTube 和 Docs Live，Google 正在将 AI 从被动的查询工具转变为主动的、具备上下文理解能力的协作伙伴。这种自然语言交互的深化，降低了用户与 AI 交互的门槛，使得 AI 能够真正融入工作流的核心环节。

其次，基础设施决定 AI 的上限。Google 宣布的巨额资本支出和 TPU 8

查看原文 →blog.google