← 返回信息流
技术博客Google AI Blog·2026/5/19

Google Workspace 推出语音功能、新设计工具及 AI 收件箱更新

原标题:New ways to create and get things done in Google Workspace

速览

Google Workspace 宣布多项新功能,包括在 Gmail、Docs 和 Keep 中引入新的语音能力。同时发布了一款名为 Google Pics 的新设计工具,并对 AI 收件箱进行了更新。这些更新旨在提升用户在文档处理、邮件管理及内容创作方面的工作效率。

AI 深度解读

Google Workspace 全新 AI 功能解读:从语音交互到自主代理的进化

背景

Google Workspace 拥有超过 40 亿用户,涵盖 Gmail、Docs 和 Drive 等核心应用,是全球用户进行内容创作、协作及日常办公的主要平台。为了进一步释放生产力,Google 在 Google AI Blog 上宣布了一系列基于人工智能的新功能和新产品。

此次更新旨在通过更自然的交互方式(如语音)、更精准的视觉创作工具以及更智能的收件箱管理,帮助用户在 Google Workspace 生态中更高效地完成任务。这些新功能主要面向 Google AI 订阅用户(包括 Plus、Pro 和 Ultra 层级)以及 Google Workspace 的企业和商业客户,标志着 Google 正在将 AI 从单纯的“问答助手”向“行动执行者”和“创意伙伴”深度转型。

核心内容

本次更新主要围绕四大核心板块展开:语音交互能力的升级、全新图像创作工具 Google Pics、AI 收件箱(AI Inbox)的功能扩展,以及个人 AI 代理 Gemini Spark。

1. 语音驱动的高效协作:让声音完成工作

Google 正在 Gmail、Docs 和 Keep 中引入新的对话式语音功能,旨在通过语音加速头脑风暴、思维整理和任务执行。

  • Gmail Live:这是一个语音激活的收件箱搜索与信息综合工具。当用户身处移动场景或无暇翻阅邮件时,只需通过语音提问(例如“我的航班登机口是多少?”或“这周孩子学校有什么安排?”),Gmail Live 即可即时搜索收件箱并合成答案。
  • Docs Live:作为用户的思维伙伴和共同作者,Docs Live 允许用户仅通过语音快速生成初稿。它不仅能整理用户的思维流,还能在获得授权后,从 Gmail、Drive、Chat 及互联网中提取相关细节,协助用户构建文档结构、调整语气并无缝创作。
  • Keep 语音整理:在 Keep 应用中,用户可以进行“思维倾倒”(brain dump),即随意口述想法。Keep 不仅能理解这些零散的叙述,还会在后台自动将其转化为结构化的笔记和列表。

这些语音功能将于今年夏季向 Google AI Pro 和 Ultra 订阅用户开放,并以预览形式提供给 Google Workspace 商业客户。

2. Google Pics:基于 Nano Banana 模型的精准图像创作

Google 推出了全新的图像创作与编辑应用 Google Pics,该应用基于最新的 Nano Banana 模型构建。其核心理念是将 AI 图像生成从“掷骰子”式的随机生成,转变为具有精确创意控制的专业设计流程。

Google Pics 提供了以下关键特性:

  • 对象分割(Object Segmentation):允许用户精确选择和编辑图像中的特定元素。用户可以移动、调整大小或完全变换对象(例如改变毛衣颜色或将狗变成猫),且不会影响图像的其他部分。
  • 文本编辑与翻译:支持直接在图片内部修改文本,或将其翻译成不同语言,同时保持原有的设计风格和字体样式。
  • Workspace 集成:Pics 将集成到 Workspace 应用中,用户可以直接在 Slides 和 Drive 中编辑图像,无需切换应用。
  • 协作功能:提供可共享的画布,允许多人同时编辑同一张图像。

Google Pics 目前正面向有限的“可信测试员”(Trusted Testers)推出,今年夏季将向全球 Google AI Pro 和 Ultra 订阅用户开放,并为 Google Workspace 商业客户提供预览版。

3. AI Inbox:更智能的收件箱管理

此前在 Gmail 中推出的 AI Inbox 功能,旨在通过智能且安全地优先处理重要更新和紧急任务,帮助用户更好地管理收件箱。此次更新将其扩展至 Google AI Plus 和 Pro 订阅用户,并增加了以下新功能:

  • 个性化草稿回复:当需要快速回复邮件时,AI Inbox 不仅会提醒用户,还会生成上下文相关的草稿,用户可在几秒内审查并发送。
  • 即时文件访问:当任务涉及审查 Google Doc、Sheet 或 Slide 时,相关文件的链接会直接显示在待办事项旁边,无需在邮件线程中翻找。
  • 简化的任务管理:用户可以通过单次点击标记单个任务为已完成、忽略无用的建议,或将特定主题下的所有邮件标记为已读,保持视图整洁。

AI Inbox 目前已向 Google AI Ultra 订阅用户开放,并向 Google Workspace Enterprise Plus 客户提供预览。此次更新开始向美国地区的 Google AI Plus 和 Pro 订阅用户 rollout。

4. Gemini Spark:24/7 个人 AI 代理

在 Google I/O 大会上宣布的 Gemini Spark 是一个全天候的个人 AI 代理,集成在 Gemini 应用中。它代表了 Gemini 的重大转变:从仅能回答问题的助手,转变为在用户指导下采取行动的代理。

  • 自主行动与权限控制:Gemini Spark 可以帮助用户导航数字生活并代表用户采取行动。但所有操作均在用户指导下进行,用户可选择开启或关闭该功能。在执行高风险操作(如发送邮件或添加日历事件)前,Spark 会先征求用户同意。
  • Workspace 集成:Gemini Spark 在 Google Workspace 中的版本即将以预览形式面向商业客户开放。

关键要点

  • 交互范式转变:Google Workspace 正从传统的点击式交互向语音驱动和代理式交互演进。Gmail Live、Docs Live 和 Keep 的语音功能强调“说即所得”,大幅降低内容创建和检索的认知负荷。
  • 创意控制的精细化:Google Pics 的推出解决了 AI 图像生成中“难以微调”的痛点。通过对象分割和文本内嵌编辑,它赋予了用户类似专业设计软件的控制力,同时保留了 AI 生成的效率。
  • AI 代理的落地:Gemini Spark 标志着 Google AI 从“信息助手”向“行动助手”的关键跨越。通过引入“人在回路”(Human-in-the-loop)的安全机制(如高风险操作前确认),Google 试图在自动化效率与用户控制权之间找到平衡。
  • 分层发布策略:新功能并非对所有用户同步开放,而是采取了分阶段、分层级的策略。通常先面向高价值订阅用户(Ultra/Pro)和测试员,再逐步扩展至商业客户和普通用户,以确保服务稳定性和收集反馈。
  • 生态闭环强化:无论是 Docs Live 调用 Drive 数据,还是 Pics 集成到 Slides,亦或是 Gemini Spark 连接 Workspace 应用,所有新功能都旨在强化 Google Workspace 内部的协同效应,减少用户在不同应用间切换的成本。

意义与影响

此次更新反映了 Google 在 AI 生产力工具领域的战略深化。首先,语音交互的普及意味着办公场景将更加碎片化和移动化,用户可以在驾驶、通勤等无法使用键盘鼠标的场景下完成复杂任务,极大地拓展了 Workspace 的使用边界。

其次,Google Pics 的出现表明 Google 正在积极切入专业创意市场。通过提供精确的编辑控制,Google 试图证明 AI 不仅是创意的起点,也可以是精细制作的工具,从而与 Adobe 等传统创意软件形成差异化竞争。

最后,Gemini Spark 作为个人 AI 代理的推出,预示着未来办公软件的核心竞争力将从“功能丰富度”转向“自动化执行力”。如果用户能够信任 AI 代理代为处理邮件、安排日程等常规事务,那么 Workspace 将不再仅仅是一个工具集,而是一个真正懂用户、能替用户工作的智能中枢。这对于提升企业员工的整体工作效率,以及重塑人机协作模式具有深远影响。

查看原文 →blog.google