技术博客Google AI Blog·2026/5/28

回顾 Google I/O 2026 十大重磅时刻

原标题：Catch up on 12 major I/O 2026 moments

速览

本文回顾了 Google I/O 2026 开发者大会上的 12 个重要时刻。重点介绍了 Gemini Omni 和 Gemini 3.5 Flash 等最新 AI 模型的发布。这些更新展示了 Google 在人工智能领域的最新进展。

AI 深度解读

Google I/O 2026 深度解读：从 Gemini Omni 到智能眼镜，重塑 AI 交互范式

背景

在 Google I/O 2026 大会上，Google 展示了其最雄心勃勃、最具突破性的新进展。本次大会的核心聚焦于两大方向：一是技术层面的重大突破，特别是全新模型 Gemini Omni 的发布，它标志着 AI 从“理解”向“创造”的跨越，能够基于任意输入（尤其是视频）生成内容；二是产品层面的深度整合，旨在通过更智能的工具提升用户的日常效率。

其中，最具代表性的产品更新包括全新的智能 Search 搜索框，它支持跨模态搜索（文本、图像、文件、视频甚至 Chrome 标签页作为输入）。此外，Google 还宣布了多项围绕 Gemini 生态系统的功能升级，涵盖从后台信息代理、个性化简报到购物助手和桌面端体验的全面革新。这些举措表明，Google 正试图将 AI 能力无缝嵌入用户生活的每一个数字触点，从搜索、创作到硬件交互。

核心内容

本次 I/O 大会主要发布了 12 个重大时刻中的前 10 项核心更新，具体解读如下：

1. Gemini Omni：多模态生成的新纪元

Gemini Omni 是 Google 最新推出的模型家族，其核心能力是“从任何输入创建任何内容”，首发聚焦于视频生成。

能力突破：用户可以混合输入图像、音频、视频和文本，生成基于 Gemini 现实世界知识的高质量视频。同时，支持通过对话轻松编辑视频。
首发型号：该家族的首款模型为 Gemini Omni Flash。
可用性：已面向全球 Google AI Plus、Pro 和 Ultra 订阅用户，通过 Gemini App 和 Google Flow 推出。同时，YouTube Shorts 和 YouTube Create App 的用户可免费使用。

2. Gemini 3.5 Flash：前沿智能与行动力结合

Gemini 3.5 系列模型旨在将前沿智能与实际行动相结合，首发型号为 Gemini 3.5 Flash。

核心优势：在代理（Agents）和编程领域提供前沿性能，擅长处理复杂的长周期任务，具有极高的现实实用价值。
可用性：
- 通过 Google Antigravity、Gemini API（Google AI Studio 和 Android Studio）、Gemini Enterprise Agent Platform 和 Gemini Enterprise 全面开放。
- 在 Search 的 AI Mode 中向所有人开放。
- 在 Gemini App 中向全球用户逐步开放。
后续计划：Gemini 3.5 Pro 已在内部使用，预计下个月向公众推出。

3. Search 中的信息代理（Information Agents）

Google 正式进入“搜索代理”时代，用户可以在 Search 中创建、定制和管理多个 AI 代理。

功能定义：首发功能为“信息代理”，它们在后台全天候（24/7）运行，智能地在网页（博客、新闻、社交媒体）以及 Google 最新数据（实时金融、购物、体育信息）中进行推理。
价值主张：帮助用户关注最重要事项，在恰当时机发送包含详细链接的综合更新。
使用方式：夏季推出，首先面向 Google AI Pro 和 Ultra 订阅用户。用户只需在搜索中加入“keep me updated”即可创建，并通过 Search AI Mode 侧边栏管理。

4. 基于 Google Antigravity 的 Search 体验

Google 将 Antigravity 技术和 Gemini 3.5 Flash 的代理编程能力直接引入 Search。

动态生成 UI：Search 可以根据用户的问题，即时构建完全定制的格式，包括动态布局、交互式视觉元素甚至完整的体验场景。
长期任务支持：对于婚礼策划、搬家管理等长期任务，Search 可以编写完整的自定义体验（如工具、仪表板或追踪器），相当于在 Search 中构建迷你应用。
可用性：生成式 UI 功能将在夏季免费向所有 Search 用户开放。自定义体验功能将在未来几个月内推出，首先面向美国地区的 Google AI Pro 和 Ultra 订阅用户。

5. Daily Brief：个性化晨间简报

在 Gemini App 中新增 Daily Brief 代理，作为用户每天的第一个信息入口。

工作原理：在后台连接用户的 Gmail、Calendar 等应用，收集紧急更新、追踪 upcoming 事件，并编译相关的后续细节。
智能优先级：不仅限于总结，而是根据用户目标主动组织和优先排序信息，甚至建议立即采取的行动步骤。用户可通过点赞或点踩来引导其优化。
可用性：夏季首先在美国向所有 18 岁以上的 Google AI 订阅用户开放，需授权连接 Google 应用。

6. Universal Cart：通用购物车

推出全新的 Universal Cart，作为 Google 上的智能购物枢纽。

跨平台整合：支持在浏览 Search、与 Gemini 聊天、观看 YouTube 甚至阅读 Gmail 时添加商品。
智能功能：后台自动寻找优惠、价格下跌、提供价格历史洞察，并在商品补货时发出警报。
可用性：夏季首先在美国的 Search 和 Gemini App 中推出，随后扩展至 YouTube 和 Gmail。

7. Neural Expressive：全新的设计语言

Google 彻底重新设计了 Gemini 的体验，推出了名为 Neural Expressive 的新设计语言。

视觉与交互：界面包含流畅动画、鲜艳色彩、新字体排版和触觉反馈。
响应式内容：Gemini 的回复不再是枯燥的文本墙，而是实时生成的定制内容，包括丰富图像、交互式时间轴、旁白视频和动态图形。
可用性：已在 Android、iOS 和 Web 端的 Gemini App 中向所有人开放。

8. Gemini Spark：24/7 个人 AI 代理

Gemini Spark 是一个集成在 Gemini App 中的 24/7 个人 AI 代理。

核心能力：集成 Gmail、Docs、Slides 等 Google 工具套件，作为云端代理，即使设备锁屏或关闭也能在后台持续工作。
用户控制：用户可设置重复任务、教授新技能、创建工作流。在执行高风险操作（如花钱、发送邮件）前，会先征求用户同意。
可用性：目前向受信任测试人员开放，并作为 Beta 版面向美国地区的 Google AI Ultra 订阅用户。

9. macOS 版 Gemini App 重大更新

Google 正在对 macOS 版 Gemini App 进行重大升级。

Spark 集成：夏季将把 Gemini Spark 带入桌面端，帮助用户处理本地文件并自动化桌面工作流。
语音体验创新：类似此前在 The Android Show 上预览的功能，利用屏幕上下文，将用户自由流动的语音（包括思考时的“嗯”、“那个”等填充词）转化为精确的草稿，并即时格式化文本以捕捉用户意图。
可用性：App 已可供所有用户下载，Spark 和语音功能将在夏季稍后推出。

10. 智能眼镜：Android XR 的新里程碑

Google 在 Android XR 领域的重要突破是智能眼镜，分为两类：

音频眼镜：提供耳内语音辅助，保持双手和头部自由。计划于今年秋季晚些时候发布，I/O 上展示了前两款设计。
显示眼镜：在需要时直接显示所需信息。
(注：原文在此处截断，但明确指出这是 Android XR 的下一个重大里程碑)

关键要点

模型能力跃迁：Gemini Omni 的发布标志着 Google 在多模态生成（特别是视频）领域进入新阶段，而 Gemini 3.5 Flash 则强化了模型在代理任务和编程方面的实战能力。
Search 的代理化转型：Search 不再仅是问答工具，而是演变为具备长期记忆和执行能力的“信息代理”平台，支持动态生成 UI 和

查看原文 →blog.google