I/O 2026:欢迎来到 Gemini 智能体时代
速览
Google I/O 2026 大会正式揭晓了 Gemini 的最新进展,标志着其全面进入智能体(Agentic)时代。此次更新旨在通过更强大的自主执行能力,帮助用户更高效地完成复杂任务。这预示着 AI 助手将从被动响应转向主动规划与执行,重塑人机交互模式。
AI 深度解读
I/O 2026:欢迎来到 Agent(智能体)Gemini 时代
背景
自上次 Google I/O 大会以来,已经过去了非凡的一年。这是一个持续快速迭代、技术突破和hyper progress(超高速发展)的时期。当前,AI 发展周期进入了一个新阶段:用户不再仅仅关注技术本身,而是迫切希望看到 AI 在他们日常使用的产品中产生的实际价值。
Google CEO 桑达尔·皮查伊(Sundar Pichai)在 I/O 2026 的演讲中指出,距离 Google 转型为“AI First”(AI 优先)公司已整整十年。在这十年间,Google 坚持采取差异化的全栈 AI 创新策略,从定制芯片和安全的底层基础,到世界级的研究与模型,再到触达数十亿用户的平台和产品。这种全栈方法使得 Google 能够以更快的速度进行迭代和创新,并照亮了公司的每一个角落。
核心内容
1. 全栈 AI 动能与数据增长
衡量 AI 进步的最佳指标是用户的使用故事,而衡量采用规模的一个关键代理指标是“Token”(令牌,即模型处理的基本数据单元)。
- Token 处理量的指数级增长:
- 两年前:每月处理 9.7 万亿 Token。
- 去年 I/O 时:增长至约 480 万亿 Token。
- 当前(I/O 2026):数字跃升 7 倍,达到每月超过 3.2 千万亿(Quadrillion) Token。
这一数据反映了产品生态的繁荣:
- 开发者规模:每月有超过 850 万 开发者利用 Google 模型构建新应用和体验。
- API 吞吐量:模型 API 每分钟处理约 190 亿 Token。
- 企业需求:过去 12 个月内,超过 375 家 Google Cloud 客户各自处理了超过 1 万亿 Token,显示出跨行业对 AI 的巨大需求。
2. 产品生态的爆发式增长
目前,Google 拥有 13 款用户数超过 10 亿的产品,其中 5 款超过 30 亿用户。Gemini 模型是驱动用户增长和活跃度的核心引擎。
-
Search(搜索):
- AI Overviews:月活跃用户(MAU)超过 25 亿。
- AI Mode:这是 Search 有史以来最大的升级,上线仅一年,MAU 已突破 10 亿。
- 体验转变:Search 正从单一的查询工具转变为持续的对话,提供更深入的见解并连接广阔的互联网内容。
-
Gemini App:
- 用户规模从去年的 4 亿 MAU 翻倍至超过 9 亿 MAU。
- 日请求量增长超过 7 倍。
- 功能亮点:引入“个人智能”(Personal Intelligence)以提供定制化回复;通过 Nano Banana 图像生成模型已生成超过 500 亿张图片。
3. 自然对话式 AI 的深化
Google 正在将更自然的对话能力嵌入到具体产品中,释放潜在的 productivity(生产力)。
-
Maps(地图):
- 进行了十年来最大的升级,推出 Ask Maps 功能。
- 用户开始使用更复杂、更长的自然语言问题进行查询。
-
Ask YouTube(测试中):
- 痛点解决:解决用户在 YouTube 海量视频中难以快速定位信息的问题。
- 功能:重新想象搜索体验,不仅推荐匹配视频,还能直接跳转到视频中最相关的片段。
- 计划:目前在美国开始测试,预计今年夏季全面推出。
-
Voice-powered Docs Live(语音驱动文档):
- 功能:利用音频模型的技术飞跃,用户无需输入精确提示词,只需通过语音“脑暴”(brain dump)想法,Gemini 即可自动整理生成文档。
- 未来展望:未来支持通过语音直接创建和编辑文档。
- 计划:今年夏季面向订阅用户推出,随后扩展到 Gmail 和 Keep。
4. 基础设施与定制芯片(TPU)
支撑如此大规模的用户和企业服务,需要巨大的基础设施投入。
- 资本支出:2022 年年度资本支出为 310 亿美元,今年预计将达到 1800 亿至 1900 亿美元(约为之前的 6 倍)。
- TPU 8 代发布:
- 首次采用双芯片架构,分别针对训练和推理进行专门优化:TPU 8t 和 TPU 8i。
- TPU 8t(训练专用):
- 原始算力是上一代的近 3 倍。
- 结合 JAX 和 Pathways 技术,训练不再受限于单个大型数据中心,而是可以在全球超过 100 万个 TPU 上无缝分布式训练。
- 意义:模型构建者可以在数周内(而非数月)训练更大、更强大的模型。
- TPU 8i(推理专用):
- 针对推理速度进行大幅优化。
- 核心理念:基于 27 年搜索经验,延迟(Latency)至关重要。
- 能效:两款芯片均更节能,性能每瓦特提升高达 2 倍。
5. Gemini Omni:迈向世界模型
- Gemini Omni:新一代模型,能够从任何输入模态生成任何输出模态的样本。
- 目前首先支持视频输出,未来将扩展至图像和文本。
- 结合了 Gemini 的智能与生成式媒体模型,实现了对“世界”理解的巨大飞跃。
- Gemini Omni Flash:
- Omni 系列的首款模型,今日正式发布。
- 用户可在 Gemini App 中试用。
关键要点
- Token 规模突破:Google 每月处理的 Token 量从两年前的 9.7 万亿激增至当前的 3.2 千万亿,增长倍数惊人,标志着 AI 应用规模的指数级扩张。
- 开发者生态繁荣:每月有 850 万开发者活跃在 Google 模型之上,API 每分钟处理 190 亿 Token,显示出强大的 B 端和开发者市场需求。
- Search 的范式转移:Search 不再仅仅是关键词匹配,AI Mode 上线一年即获 10 亿用户,标志着搜索进入“持续对话”时代。
- Gemini App 成为超级入口:用户数突破 9 亿,日请求量增长 7 倍,证明移动端 AI 助手已成为主流。
- 产品功能具体化:
- Ask YouTube:解决视频内容检索痛点,直接跳转关键片段。
- Docs Live:通过语音“脑暴”自动生成文档,降低创作门槛。
- Ask Maps:支持复杂自然语言查询。
- 基础设施巨额投入:年度资本支出预计达 1800-1900 亿美元,重点投入定制芯片 TPU。
- TPU 8 代双芯片架构:
- TPU 8t:通过分布式训练(JAX/Pathways)打破单数据中心限制,实现全球百万级 TPU 集群训练。
- TPU 8i:极致优化推理速度,降低延迟。
- Gemini Omni 发布:首款多模态生成模型 Gemini Omni Flash 上线,标志着 AI 从“预测文本”向“模拟现实”的世界模型演进。
意义与影响
Google I/O 2026 的核心信号是:**AI 已从“技术展示”阶段全面进入“价值兑现”与“智能体
