← 返回信息流
技术博客Google AI Blog·2026/5/19

Google I/O 2026:拥抱 Gemini 智能体时代

原标题:I/O 2026: Welcome to the agentic Gemini era

速览

Google 在 I/O 2026 大会上发布了关于 Gemini 的最新进展,重点介绍了智能体(Agentic)技术的演进。此次更新旨在通过更强大的 AI 能力,帮助用户更高效地完成各类任务。这标志着 Google 在 AI 产品化道路上迈出了重要一步,正式开启智能体驱动的新阶段。

AI 深度解读

I/O 2026:欢迎来到 Agentic Gemini 时代

背景

自上次 Google I/O 大会以来,已经过去了非凡的一年。这段时间见证了 Google 在技术推进和“超高速”迭代方面的不懈努力。当前,AI 发展周期已进入一个新阶段:用户不再仅仅关注技术本身,而是迫切希望在日常使用的产品中看到切实的价值。

Google CEO Sundar Pichai 在 I/O 2026 的演讲中指出,距离 Google 转向“AI-first”(AI 优先)战略已整整十年。Google 依然认为,AI 是深化其使命、大规模改善人们生活的最深刻方式。为此,Google 采取了一种差异化的全栈式 AI 创新方法:从定制硅芯片和安全的底层基础,到世界级的研究与模型,再到触及数十亿用户的最终产品与平台。这种全栈能力使得 Google 能够以更快的速度进行迭代和创新,并点亮了公司的每一个部分。

核心内容

全栈 AI 势头的量化证明

衡量 AI 进步的最佳指标是用户如何使用它,而衡量采用规模的一个关键代理指标是“Token”(模型处理的基本数据单位)。

  • Token 处理量的爆炸式增长:两年前,Google 各产品表面每月处理的 Token 数量为 9.7 万亿;去年 I/O 时增长至约 480 万亿;而截至目前,这一数字已跃升 7 倍,达到每月超过 32 万亿(3.2 quadrillion)。
  • 开发者与企业参与度
    • 每月有超过 850 万名开发者正在使用 Google 的模型构建新应用和体验。
    • Google 的模型 API 每分钟处理约 190 亿个 Token。
    • 在过去 12 个月中,超过 375 家 Google Cloud 客户各自处理了超过 1 万亿个 Token,显示出各行业对 AI 的巨大需求。

产品势头的爆发

目前,Google 拥有 13 款月活跃用户(MAU)超过 10 亿的产品,其中 5 款的 MAU 超过 30 亿。Gemini 模型是推动用户增长和使用频率提升的核心动力。

  • Search(搜索)
    • AI Overviews:月活跃用户已超过 25 亿。
    • AI Mode:这是 Search 历史上最大的升级,上线仅一年,MAU 已突破 10 亿。Search 正从单一的查询工具转变为持续的对话体验,提供更深入的洞察并连接更广阔的网络内容。
  • Gemini App
    • MAU 从去年的 4 亿增长至今天的超过 9 亿,一年内翻倍。
    • 每日请求量增长了七倍以上。
    • 新增功能如“Personal Intelligence”(个人智能)使响应更加定制化和有帮助。
    • 基于 Nano Banana 图像生成模型,至今已生成超过 500 亿张图像,展现了巨大的潜在创造力。

产品中的自然对话式 AI

Google 正在将更自然的对话能力引入核心产品,以释放生产力潜力。

  • Maps(地图)
    • 迎来了十年来最大的升级,新增 Ask Maps 功能。用户现在可以提出更复杂、更长的自然语言问题。
  • YouTube
    • 推出 Ask YouTube 功能,彻底重构了搜索体验。它能根据用户兴趣匹配视频,并直接跳转到视频中最相关的片段,使信息更易消化和导航。
    • 目前在美国开始测试,预计今年夏季广泛推出。
  • Docs(文档)
    • 推出 Docs Live 功能。得益于音频模型的技术飞跃,用户不再需要输入精确的提示词,而是可以通过语音进行“思维倾倒”(brain dump),由 Gemini 自动整理和生成文档。
    • 该功能今年夏季面向订阅用户推出,随后强大的语音能力也将延伸至 Gmail 和 Keep。

支撑大规模创新的基础设施

为了支持如此规模的用户增长以及服务全球的企业和开发者,Google 在基础设施上进行了巨额投资。

  • 资本支出(Capex):2022 年年度资本支出为 310 亿美元,预计今年将达到之前的六倍左右,约为 1800 亿至 1900 亿美元。
  • 定制硅芯片(TPU)
    • 自十年前发布首款商用 TPU 以来,Google 彻底改变了行业构建 AI 的方式。
    • 在 Cloud Next 上发布了第 8 代 TPU,首次采用双芯片架构,分别针对训练和推理进行专门优化:TPU 8tTPU 8i
      • TPU 8t:专为大规模预训练优化,原始算力约为上一代的三倍。结合 JAX 和 Pathways,训练不再受限于单个大型数据中心,而是可以无缝分布在多个站点,全球可扩展至超过 100 万个 TPU,形成世界上最大的训练集群。这使得模型构建者能在数周内而非数月内训练更大、更强大的模型。
      • TPU 8i:专为推理设计。Google 深知“延迟至关重要”,因此在每一步都大幅提升了速度。
    • 能效:两款芯片均提高了能源效率,每瓦特性能提升高达两倍。

Gemini Omni:迈向世界模型

TPU 的进步使得模型、编码和智能体(Agents)的计算能力得以突破。随着世界模型(World Models)的发展,AI 正从预测文本转向模拟现实。

  • Gemini Omni:这是一款新模型,能够从任何输入模态生成任何输出模态的样本。初期支持视频输出,未来将扩展至图像和文本。它结合了 Gemini 的智能与生成式媒体模型,在“世界理解”方面取得了巨大飞跃。
  • Gemini Omni Flash:Omni 系列的首款模型,即日起可用。用户可以在 Gemini App 中尝试该模型。

关键要点

  • Token 规模呈指数级增长:Google 每月处理的 Token 数量从两年前的 9.7 万亿飙升至目前的 32 万亿以上,反映了 AI 采用率的惊人速度。
  • 开发者生态繁荣:每月有 850 万开发者利用 Google 模型构建应用,API 每分钟处理 190 亿 Token,显示出强大的 B 端需求。
  • 核心产品全面 AI 化
    • Search 的 AI Mode 在一年内达到 10 亿 MAU,改变了搜索的交互范式。
    • Gemini App 用户数突破 9 亿,图像生成量达 500 亿张。
  • 交互方式向自然语言转变:Maps 的 Ask Maps、YouTube 的 Ask YouTube 以及 Docs 的 Docs Live,均强调通过自然对话和语音交互来提升效率和体验。
  • 基础设施投资巨大:年度资本支出预计达 1800-1900 亿美元,重点投入定制硅芯片。
  • TPU 8 代双架构:推出专用于训练的 TPU 8t 和专用于推理的 TPU 8i,支持全球百万级 TPU 集群训练,显著提升训练速度和能效。
  • Gemini Omni 发布:首款多模态生成模型 Gemini Omni Flash 上线,标志着 AI 从文本预测向模拟现实(世界模型)迈进。

意义与影响

Google I/O 2026 的发布标志着 Google 正式进入“Agentic Gemini”(智能体 Gemini)时代。这不仅是产品功能的更新,更是 Google 全栈 AI 战略成熟度的集中体现。

首先,从“工具”到“伙伴”的转变。通过 Ask Maps、Ask YouTube 和 Docs Live,Google 正在将 AI 从被动的查询工具转变为主动的、具备上下文理解能力的协作伙伴。这种自然语言交互的深化,降低了用户与 AI 交互的门槛,使得 AI 能够真正融入工作流的核心环节。

其次,基础设施决定 AI 的上限。Google 宣布的巨额资本支出和 TPU 8

查看原文 →blog.google