技术博客Google AI Blog·1 小时前

Google公布2026年5月最新AI更新

原标题：The latest AI news we announced in May 2026

速览

Google于2026年5月公布了其最新的AI领域更新动态。此次发布涵盖了多项人工智能技术与产品的最新进展。这些更新反映了Google在AI领域的持续投入与创新方向。

AI 深度解读

2026年5月Google AI动态深度解读：进入“代理式”智能的新纪元

背景

在过去二十多年里，Google 持续在机器学习、AI 研究、工具及基础设施领域进行大规模投入，旨在构建能够改善更多人日常生活的产品。Google 内部各团队正致力于在医疗健康、危机响应和教育等广泛领域释放 AI 的潜力。

为了向公众同步最新进展，Google AI Blog 定期发布 AI 新闻综述。2026年5月是 Google AI 发布密集期，特别是在 Google I/O 2026 大会上，Google 正式宣布进入“代理式 Gemini（Agentic Gemini）”时代。这一时期不仅发布了前沿模型，还推出了专为 AI 工具设计的新硬件，并拓展了个人健康与量子科学应用。整体而言，5月的核心主题是将 AI 变得更加主动、更具帮助性，并深度融入用户的日常生活。

核心内容

1. 模型与核心能力的突破

Gemini Omni 的发布 Google 推出了全新模型 Gemini Omni。该模型具备从任何输入中创造内容的能力，首发功能聚焦于视频生成。用户可以将图像、音频、视频和文本作为输入，结合 Gemini 对现实世界的知识，生成高质量的视频内容。

Gemini 3.5 与代理式工作流 作为最新一代模型家族，Gemini 3.5 将前沿智能与行动能力相结合。它具备强大的“行动（Action-taking）”能力，旨在帮助用户可靠地执行跨应用的复杂、多步骤代理式工作流。此外，Gemini 3.5 Flash 版本也带来了代理式编码能力。

Gemini 应用的升级 Gemini App 正在演变为更强大的 AI 助手。除了直观的新用户界面（UI）和个性化的每日简报外，还引入了 Gemini Spark 功能。它不再局限于被动回答问题，而是作为主动助手，在后台管理收件箱、安排约会并预判日常需求。

2. 搜索与浏览器的智能化重塑

Search 的新纪元 Google Search 引入了新一代功能，将网络最佳内容与 AI 优势相结合：

信息代理（Information Agents）： 在后台全天候（24/7）智能工作，监控用户指定的信息，并在有更新时发送包含详细链接的摘要，以便用户深入阅读或采取行动。
生成式 UI 与交互视觉： 利用 Gemini 3.5 Flash 的代理式编码能力，Search 能够根据用户问题构建生成式 UI 和交互式视觉内容，例如为持续任务定制仪表盘或迷你应用。
全新搜索框： 推出了 25 年来最大升级的智能搜索框。
案例演示： 用户可要求 Search 编写自定义健身追踪器代码，并利用实时数据（如评论、实时地图和天气）来保持进度。

内容透明度增强 为了帮助用户理解内容的创作和编辑过程，Google 正在扩大其在 Google Search、Gemini、Chrome、Pixel 和 Cloud 中的内容透明度和验证工具，以识别 AI 生成内容。

3. 硬件与操作系统的新整合

Android 生态的主动化

Android Halo： 为帮助用户管理 AI 代理，Google 推出了 Android Halo。这是手机上的一个新空间，允许用户查看代理的工作进度并接收上下文辅助，且不会打断用户当前的操作流程。
Gemini Intelligence 赋能手机： Android 变得更加主动。借助 Gemini Intelligence，手机能更好地理解上下文，将口语化的想法转化为精炼文本，并主动建议行动以辅助用户度过一天。
车载 Android： 下一代车载 Android 系统带来了高度对话式的语音控制、主动路线规划以及更丰富的娱乐选项，提升驾驶体验。

全新硬件产品

Googlebook： 由 Acer、Asus、Dell、HP 和 Lenovo 等硬件合作伙伴制造的全新笔记本电脑体验，专为 Gemini Intelligence 从头设计。特色功能包括用于上下文建议的“Magic Pointer”、任务组织自定义小部件以及跨设备功能。
Fitbit Air： Google 最小的追踪器，采用高保真传感器技术，体积小巧隐蔽。支持 24/7 心率监测、房颤（Afib）警报、血氧饱和度（SpO2）、静息心率、心率变异性、睡眠阶段和时长等高级健康追踪功能。
智能眼镜： 发布了即将推出的智能眼镜，具备新镜框和功能，允许用户在不拿出手机的情况下获取方向、发送短信和拍照。

4. 生活、健康与科学应用

Universal Cart（通用购物车） 这是 Google 购物的新中心，支持跨商家和服务。用户可以在浏览 Search、与 Gemini 聊天、观看 YouTube 甚至阅读 Gmail 时，将商品添加到购物车中。

Google Health 应用 全新推出的 Google Health 应用将所有健康和福祉数据整合到一个平台，并发布了新的先进功能。

科学探索与量子计算

Project Genie 与 Street View： 结合两者，推出了实验性功能，允许用户通过浏览器模拟和探索高度逼真的交互式 3D 真实世界环境。
Gemini for Science： 发布了一系列科学工具和实验，旨在扩大科学探索的规模和精度。
AlphaEvolve 的现实影响： 展示了 AlphaEvolve 在优化复杂物流供应链、芯片设计、模拟分子系统和电网等方面的实际应用。
REPLIQA 计划： 启动了“生命科学与量子 AI 交叉点研究计划”，承诺向五所大学投入 1000 万美元，将先进的量子科学和 AI 应用于生命科学，以改善人类健康结果。
Google DeepMind 加速器（亚太地区）： 支持利用前沿 AI 解决气候、能源和环境挑战的初创企业。

音乐创作合作 Google Flow Music 与 Believe 建立新合作伙伴关系，为艺术家和制作人提供创意 AI 协作工具，协助从歌词旋律构思到歌曲最终润色的全过程。

关键要点

进入代理式 AI 时代： Google 明确将 Gemini 3.5 和 Gemini Omni 定义为具备“行动能力”的模型，标志着从被动问答向主动执行复杂工作流的转变。
Search 的功能性重构： Search 不再仅是信息检索入口，而是演变为具备后台监控、生成式 UI 构建和代码执行能力的智能代理平台。
硬件与 OS 的深度耦合： 新发布的 Googlebook、Fitbit Air 以及 Android Halo 等功能，均围绕“主动式 AI”设计，强调无缝的跨设备体验和上下文感知。
健康与科学的垂直深化： 通过 Google Health、Fitbit Air 的医疗级监测功能，以及 REPLIQA 量子 AI 计划，Google 正在将 AI 能力深入至高精度科学探索和个体健康管理领域。
内容生态的透明化： 面对 AI 生成内容的普及，Google 开始在核心产品（Search, Chrome, Gemini）中加强内容来源的透明度和验证工具。
开放合作模式： 在硬件（与多家 PC 厂商合作）、音乐（与 Believe 合作）和科研（与大学合作）领域，Google 采取了广泛的合作伙伴关系策略来扩展 AI 的应用边界。

意义与影响

2026年5月的这一系列发布，标志着 Google AI 战略的重大转折：从“生成内容”转向“执行任务”。

首先，人机交互范式的改变。通过 Gemini 3.5 的代理式能力和 Android 的主动化升级，AI 角色从“搜索引擎”转变为“个人助理”。用户不再需要手动执行多步骤操作，AI 将在后台主动管理日程、监控信息并执行代码，这极大地提升了生产力，但也对隐私保护和用户控制权提出了新的挑战。

其次，AI 能力的边界拓展至物理世界与科学前沿。通过 Street View 的 3D 模拟、量子 AI 在生命科学中的应用，以及 Fitbit Air 的高精度健康监测，AI 正在突破数字屏幕的限制，深入影响现实世界的物理交互和人类健康决策。

最后，生态系统的全面整合。Universal Cart 和 Googlebook 的推出，显示了 Google 试图打通搜索、购物、创作和硬件之间的壁垒，构建一个以 Gemini Intelligence 为核心的闭环生态系统。这种整合不仅增强了用户粘性，也为 AI 技术在商业和日常生活中的规模化落地提供了基础设施。

查看原文 →blog.google