技术博客Google AI Blog·15 天前

I/O 2026：欢迎来到 Gemini 智能体时代

原标题：I/O 2026: Welcome to the agentic Gemini era

速览

Google I/O 2026 大会正式揭晓了 Gemini 的最新进展，标志着其全面进入智能体（Agentic）时代。此次更新旨在通过更强大的自主执行能力，帮助用户更高效地完成复杂任务。这预示着 AI 助手将从被动响应转向主动规划与执行，重塑人机交互模式。

AI 深度解读

I/O 2026：欢迎来到 Agent（智能体）Gemini 时代

背景

自上次 Google I/O 大会以来，已经过去了非凡的一年。这是一个持续快速迭代、技术突破和hyper progress（超高速发展）的时期。当前，AI 发展周期进入了一个新阶段：用户不再仅仅关注技术本身，而是迫切希望看到 AI 在他们日常使用的产品中产生的实际价值。

Google CEO 桑达尔·皮查伊（Sundar Pichai）在 I/O 2026 的演讲中指出，距离 Google 转型为“AI First”（AI 优先）公司已整整十年。在这十年间，Google 坚持采取差异化的全栈 AI 创新策略，从定制芯片和安全的底层基础，到世界级的研究与模型，再到触达数十亿用户的平台和产品。这种全栈方法使得 Google 能够以更快的速度进行迭代和创新，并照亮了公司的每一个角落。

核心内容

1. 全栈 AI 动能与数据增长

衡量 AI 进步的最佳指标是用户的使用故事，而衡量采用规模的一个关键代理指标是“Token”（令牌，即模型处理的基本数据单元）。

Token 处理量的指数级增长：
- 两年前：每月处理 9.7 万亿 Token。
- 去年 I/O 时：增长至约 480 万亿 Token。
- 当前（I/O 2026）：数字跃升 7 倍，达到每月超过 3.2 千万亿（Quadrillion） Token。

这一数据反映了产品生态的繁荣：

开发者规模：每月有超过 850 万 开发者利用 Google 模型构建新应用和体验。
API 吞吐量：模型 API 每分钟处理约 190 亿 Token。
企业需求：过去 12 个月内，超过 375 家 Google Cloud 客户各自处理了超过 1 万亿 Token，显示出跨行业对 AI 的巨大需求。

2. 产品生态的爆发式增长

目前，Google 拥有 13 款用户数超过 10 亿的产品，其中 5 款超过 30 亿用户。Gemini 模型是驱动用户增长和活跃度的核心引擎。

Search（搜索）：
- AI Overviews：月活跃用户（MAU）超过 25 亿。
- AI Mode：这是 Search 有史以来最大的升级，上线仅一年，MAU 已突破 10 亿。
- 体验转变：Search 正从单一的查询工具转变为持续的对话，提供更深入的见解并连接广阔的互联网内容。
Gemini App：
- 用户规模从去年的 4 亿 MAU 翻倍至超过 9 亿 MAU。
- 日请求量增长超过 7 倍。
- 功能亮点：引入“个人智能”（Personal Intelligence）以提供定制化回复；通过 Nano Banana 图像生成模型已生成超过 500 亿张图片。

3. 自然对话式 AI 的深化

Google 正在将更自然的对话能力嵌入到具体产品中，释放潜在的 productivity（生产力）。

Maps（地图）：
- 进行了十年来最大的升级，推出 Ask Maps 功能。
- 用户开始使用更复杂、更长的自然语言问题进行查询。
Ask YouTube（测试中）：
- 痛点解决：解决用户在 YouTube 海量视频中难以快速定位信息的问题。
- 功能：重新想象搜索体验，不仅推荐匹配视频，还能直接跳转到视频中最相关的片段。
- 计划：目前在美国开始测试，预计今年夏季全面推出。
Voice-powered Docs Live（语音驱动文档）：
- 功能：利用音频模型的技术飞跃，用户无需输入精确提示词，只需通过语音“脑暴”（brain dump）想法，Gemini 即可自动整理生成文档。
- 未来展望：未来支持通过语音直接创建和编辑文档。
- 计划：今年夏季面向订阅用户推出，随后扩展到 Gmail 和 Keep。

4. 基础设施与定制芯片（TPU）

支撑如此大规模的用户和企业服务，需要巨大的基础设施投入。

资本支出：2022 年年度资本支出为 310 亿美元，今年预计将达到 1800 亿至 1900 亿美元（约为之前的 6 倍）。
TPU 8 代发布：
- 首次采用双芯片架构，分别针对训练和推理进行专门优化：TPU 8t 和 TPU 8i。
- TPU 8t（训练专用）：
  - 原始算力是上一代的近 3 倍。
  - 结合 JAX 和 Pathways 技术，训练不再受限于单个大型数据中心，而是可以在全球超过 100 万个 TPU 上无缝分布式训练。
  - 意义：模型构建者可以在数周内（而非数月）训练更大、更强大的模型。
- TPU 8i（推理专用）：
  - 针对推理速度进行大幅优化。
  - 核心理念：基于 27 年搜索经验，延迟（Latency）至关重要。
- 能效：两款芯片均更节能，性能每瓦特提升高达 2 倍。

5. Gemini Omni：迈向世界模型

Gemini Omni：新一代模型，能够从任何输入模态生成任何输出模态的样本。
- 目前首先支持视频输出，未来将扩展至图像和文本。
- 结合了 Gemini 的智能与生成式媒体模型，实现了对“世界”理解的巨大飞跃。
Gemini Omni Flash：
- Omni 系列的首款模型，今日正式发布。
- 用户可在 Gemini App 中试用。

关键要点

Token 规模突破：Google 每月处理的 Token 量从两年前的 9.7 万亿激增至当前的 3.2 千万亿，增长倍数惊人，标志着 AI 应用规模的指数级扩张。
开发者生态繁荣：每月有 850 万开发者活跃在 Google 模型之上，API 每分钟处理 190 亿 Token，显示出强大的 B 端和开发者市场需求。
Search 的范式转移：Search 不再仅仅是关键词匹配，AI Mode 上线一年即获 10 亿用户，标志着搜索进入“持续对话”时代。
Gemini App 成为超级入口：用户数突破 9 亿，日请求量增长 7 倍，证明移动端 AI 助手已成为主流。
产品功能具体化：
- Ask YouTube：解决视频内容检索痛点，直接跳转关键片段。
- Docs Live：通过语音“脑暴”自动生成文档，降低创作门槛。
- Ask Maps：支持复杂自然语言查询。
基础设施巨额投入：年度资本支出预计达 1800-1900 亿美元，重点投入定制芯片 TPU。
TPU 8 代双芯片架构：
- TPU 8t：通过分布式训练（JAX/Pathways）打破单数据中心限制，实现全球百万级 TPU 集群训练。
- TPU 8i：极致优化推理速度，降低延迟。
Gemini Omni 发布：首款多模态生成模型 Gemini Omni Flash 上线，标志着 AI 从“预测文本”向“模拟现实”的世界模型演进。

意义与影响

Google I/O 2026 的核心信号是：**AI 已从“技术展示”阶段全面进入“价值兑现”与“智能体

查看原文 →blog.google