← 返回信息流
技术博客Google AI Blog·1 小时前

Google公布2026年5月最新AI更新

原标题:The latest AI news we announced in May 2026

速览

Google于2026年5月公布了其最新的AI领域更新动态。此次发布涵盖了多项人工智能技术与产品的最新进展。这些更新反映了Google在AI领域的持续投入与创新方向。

AI 深度解读

2026年5月Google AI动态深度解读:进入“代理式”智能的新纪元

背景

在过去二十多年里,Google 持续在机器学习、AI 研究、工具及基础设施领域进行大规模投入,旨在构建能够改善更多人日常生活的产品。Google 内部各团队正致力于在医疗健康、危机响应和教育等广泛领域释放 AI 的潜力。

为了向公众同步最新进展,Google AI Blog 定期发布 AI 新闻综述。2026年5月是 Google AI 发布密集期,特别是在 Google I/O 2026 大会上,Google 正式宣布进入“代理式 Gemini(Agentic Gemini)”时代。这一时期不仅发布了前沿模型,还推出了专为 AI 工具设计的新硬件,并拓展了个人健康与量子科学应用。整体而言,5月的核心主题是将 AI 变得更加主动、更具帮助性,并深度融入用户的日常生活。

核心内容

1. 模型与核心能力的突破

Gemini Omni 的发布 Google 推出了全新模型 Gemini Omni。该模型具备从任何输入中创造内容的能力,首发功能聚焦于视频生成。用户可以将图像、音频、视频和文本作为输入,结合 Gemini 对现实世界的知识,生成高质量的视频内容。

Gemini 3.5 与代理式工作流 作为最新一代模型家族,Gemini 3.5 将前沿智能与行动能力相结合。它具备强大的“行动(Action-taking)”能力,旨在帮助用户可靠地执行跨应用的复杂、多步骤代理式工作流。此外,Gemini 3.5 Flash 版本也带来了代理式编码能力。

Gemini 应用的升级 Gemini App 正在演变为更强大的 AI 助手。除了直观的新用户界面(UI)和个性化的每日简报外,还引入了 Gemini Spark 功能。它不再局限于被动回答问题,而是作为主动助手,在后台管理收件箱、安排约会并预判日常需求。

2. 搜索与浏览器的智能化重塑

Search 的新纪元 Google Search 引入了新一代功能,将网络最佳内容与 AI 优势相结合:

  • 信息代理(Information Agents): 在后台全天候(24/7)智能工作,监控用户指定的信息,并在有更新时发送包含详细链接的摘要,以便用户深入阅读或采取行动。
  • 生成式 UI 与交互视觉: 利用 Gemini 3.5 Flash 的代理式编码能力,Search 能够根据用户问题构建生成式 UI 和交互式视觉内容,例如为持续任务定制仪表盘或迷你应用。
  • 全新搜索框: 推出了 25 年来最大升级的智能搜索框。
  • 案例演示: 用户可要求 Search 编写自定义健身追踪器代码,并利用实时数据(如评论、实时地图和天气)来保持进度。

内容透明度增强 为了帮助用户理解内容的创作和编辑过程,Google 正在扩大其在 Google Search、Gemini、Chrome、Pixel 和 Cloud 中的内容透明度和验证工具,以识别 AI 生成内容。

3. 硬件与操作系统的新整合

Android 生态的主动化

  • Android Halo: 为帮助用户管理 AI 代理,Google 推出了 Android Halo。这是手机上的一个新空间,允许用户查看代理的工作进度并接收上下文辅助,且不会打断用户当前的操作流程。
  • Gemini Intelligence 赋能手机: Android 变得更加主动。借助 Gemini Intelligence,手机能更好地理解上下文,将口语化的想法转化为精炼文本,并主动建议行动以辅助用户度过一天。
  • 车载 Android: 下一代车载 Android 系统带来了高度对话式的语音控制、主动路线规划以及更丰富的娱乐选项,提升驾驶体验。

全新硬件产品

  • Googlebook: 由 Acer、Asus、Dell、HP 和 Lenovo 等硬件合作伙伴制造的全新笔记本电脑体验,专为 Gemini Intelligence 从头设计。特色功能包括用于上下文建议的“Magic Pointer”、任务组织自定义小部件以及跨设备功能。
  • Fitbit Air: Google 最小的追踪器,采用高保真传感器技术,体积小巧隐蔽。支持 24/7 心率监测、房颤(Afib)警报、血氧饱和度(SpO2)、静息心率、心率变异性、睡眠阶段和时长等高级健康追踪功能。
  • 智能眼镜: 发布了即将推出的智能眼镜,具备新镜框和功能,允许用户在不拿出手机的情况下获取方向、发送短信和拍照。

4. 生活、健康与科学应用

Universal Cart(通用购物车) 这是 Google 购物的新中心,支持跨商家和服务。用户可以在浏览 Search、与 Gemini 聊天、观看 YouTube 甚至阅读 Gmail 时,将商品添加到购物车中。

Google Health 应用 全新推出的 Google Health 应用将所有健康和福祉数据整合到一个平台,并发布了新的先进功能。

科学探索与量子计算

  • Project Genie 与 Street View: 结合两者,推出了实验性功能,允许用户通过浏览器模拟和探索高度逼真的交互式 3D 真实世界环境。
  • Gemini for Science: 发布了一系列科学工具和实验,旨在扩大科学探索的规模和精度。
  • AlphaEvolve 的现实影响: 展示了 AlphaEvolve 在优化复杂物流供应链、芯片设计、模拟分子系统和电网等方面的实际应用。
  • REPLIQA 计划: 启动了“生命科学与量子 AI 交叉点研究计划”,承诺向五所大学投入 1000 万美元,将先进的量子科学和 AI 应用于生命科学,以改善人类健康结果。
  • Google DeepMind 加速器(亚太地区): 支持利用前沿 AI 解决气候、能源和环境挑战的初创企业。

音乐创作合作 Google Flow Music 与 Believe 建立新合作伙伴关系,为艺术家和制作人提供创意 AI 协作工具,协助从歌词旋律构思到歌曲最终润色的全过程。

关键要点

  • 进入代理式 AI 时代: Google 明确将 Gemini 3.5 和 Gemini Omni 定义为具备“行动能力”的模型,标志着从被动问答向主动执行复杂工作流的转变。
  • Search 的功能性重构: Search 不再仅是信息检索入口,而是演变为具备后台监控、生成式 UI 构建和代码执行能力的智能代理平台。
  • 硬件与 OS 的深度耦合: 新发布的 Googlebook、Fitbit Air 以及 Android Halo 等功能,均围绕“主动式 AI”设计,强调无缝的跨设备体验和上下文感知。
  • 健康与科学的垂直深化: 通过 Google Health、Fitbit Air 的医疗级监测功能,以及 REPLIQA 量子 AI 计划,Google 正在将 AI 能力深入至高精度科学探索和个体健康管理领域。
  • 内容生态的透明化: 面对 AI 生成内容的普及,Google 开始在核心产品(Search, Chrome, Gemini)中加强内容来源的透明度和验证工具。
  • 开放合作模式: 在硬件(与多家 PC 厂商合作)、音乐(与 Believe 合作)和科研(与大学合作)领域,Google 采取了广泛的合作伙伴关系策略来扩展 AI 的应用边界。

意义与影响

2026年5月的这一系列发布,标志着 Google AI 战略的重大转折:从“生成内容”转向“执行任务”

首先,人机交互范式的改变。通过 Gemini 3.5 的代理式能力和 Android 的主动化升级,AI 角色从“搜索引擎”转变为“个人助理”。用户不再需要手动执行多步骤操作,AI 将在后台主动管理日程、监控信息并执行代码,这极大地提升了生产力,但也对隐私保护和用户控制权提出了新的挑战。

其次,AI 能力的边界拓展至物理世界与科学前沿。通过 Street View 的 3D 模拟、量子 AI 在生命科学中的应用,以及 Fitbit Air 的高精度健康监测,AI 正在突破数字屏幕的限制,深入影响现实世界的物理交互和人类健康决策。

最后,生态系统的全面整合。Universal Cart 和 Googlebook 的推出,显示了 Google 试图打通搜索、购物、创作和硬件之间的壁垒,构建一个以 Gemini Intelligence 为核心的闭环生态系统。这种整合不仅增强了用户粘性,也为 AI 技术在商业和日常生活中的规模化落地提供了基础设施。

查看原文 →blog.google