技术博客Google AI Blog·2026/5/19

Google Workspace 推出语音功能、新设计工具及 AI 收件箱更新

原标题：New ways to create and get things done in Google Workspace

速览

Google Workspace 宣布多项新功能，包括在 Gmail、Docs 和 Keep 中引入新的语音能力。同时发布了一款名为 Google Pics 的新设计工具，并对 AI 收件箱进行了更新。这些更新旨在提升用户在文档处理、邮件管理及内容创作方面的工作效率。

AI 深度解读

Google Workspace 全新 AI 功能解读：从语音交互到自主代理的进化

背景

Google Workspace 拥有超过 40 亿用户，涵盖 Gmail、Docs 和 Drive 等核心应用，是全球用户进行内容创作、协作及日常办公的主要平台。为了进一步释放生产力，Google 在 Google AI Blog 上宣布了一系列基于人工智能的新功能和新产品。

此次更新旨在通过更自然的交互方式（如语音）、更精准的视觉创作工具以及更智能的收件箱管理，帮助用户在 Google Workspace 生态中更高效地完成任务。这些新功能主要面向 Google AI 订阅用户（包括 Plus、Pro 和 Ultra 层级）以及 Google Workspace 的企业和商业客户，标志着 Google 正在将 AI 从单纯的“问答助手”向“行动执行者”和“创意伙伴”深度转型。

核心内容

本次更新主要围绕四大核心板块展开：语音交互能力的升级、全新图像创作工具 Google Pics、AI 收件箱（AI Inbox）的功能扩展，以及个人 AI 代理 Gemini Spark。

1. 语音驱动的高效协作：让声音完成工作

Google 正在 Gmail、Docs 和 Keep 中引入新的对话式语音功能，旨在通过语音加速头脑风暴、思维整理和任务执行。

Gmail Live：这是一个语音激活的收件箱搜索与信息综合工具。当用户身处移动场景或无暇翻阅邮件时，只需通过语音提问（例如“我的航班登机口是多少？”或“这周孩子学校有什么安排？”），Gmail Live 即可即时搜索收件箱并合成答案。
Docs Live：作为用户的思维伙伴和共同作者，Docs Live 允许用户仅通过语音快速生成初稿。它不仅能整理用户的思维流，还能在获得授权后，从 Gmail、Drive、Chat 及互联网中提取相关细节，协助用户构建文档结构、调整语气并无缝创作。
Keep 语音整理：在 Keep 应用中，用户可以进行“思维倾倒”（brain dump），即随意口述想法。Keep 不仅能理解这些零散的叙述，还会在后台自动将其转化为结构化的笔记和列表。

这些语音功能将于今年夏季向 Google AI Pro 和 Ultra 订阅用户开放，并以预览形式提供给 Google Workspace 商业客户。

2. Google Pics：基于 Nano Banana 模型的精准图像创作

Google 推出了全新的图像创作与编辑应用 Google Pics，该应用基于最新的 Nano Banana 模型构建。其核心理念是将 AI 图像生成从“掷骰子”式的随机生成，转变为具有精确创意控制的专业设计流程。

Google Pics 提供了以下关键特性：

对象分割（Object Segmentation）：允许用户精确选择和编辑图像中的特定元素。用户可以移动、调整大小或完全变换对象（例如改变毛衣颜色或将狗变成猫），且不会影响图像的其他部分。
文本编辑与翻译：支持直接在图片内部修改文本，或将其翻译成不同语言，同时保持原有的设计风格和字体样式。
Workspace 集成：Pics 将集成到 Workspace 应用中，用户可以直接在 Slides 和 Drive 中编辑图像，无需切换应用。
协作功能：提供可共享的画布，允许多人同时编辑同一张图像。

Google Pics 目前正面向有限的“可信测试员”（Trusted Testers）推出，今年夏季将向全球 Google AI Pro 和 Ultra 订阅用户开放，并为 Google Workspace 商业客户提供预览版。

3. AI Inbox：更智能的收件箱管理

此前在 Gmail 中推出的 AI Inbox 功能，旨在通过智能且安全地优先处理重要更新和紧急任务，帮助用户更好地管理收件箱。此次更新将其扩展至 Google AI Plus 和 Pro 订阅用户，并增加了以下新功能：

个性化草稿回复：当需要快速回复邮件时，AI Inbox 不仅会提醒用户，还会生成上下文相关的草稿，用户可在几秒内审查并发送。
即时文件访问：当任务涉及审查 Google Doc、Sheet 或 Slide 时，相关文件的链接会直接显示在待办事项旁边，无需在邮件线程中翻找。
简化的任务管理：用户可以通过单次点击标记单个任务为已完成、忽略无用的建议，或将特定主题下的所有邮件标记为已读，保持视图整洁。

AI Inbox 目前已向 Google AI Ultra 订阅用户开放，并向 Google Workspace Enterprise Plus 客户提供预览。此次更新开始向美国地区的 Google AI Plus 和 Pro 订阅用户 rollout。

4. Gemini Spark：24/7 个人 AI 代理

在 Google I/O 大会上宣布的 Gemini Spark 是一个全天候的个人 AI 代理，集成在 Gemini 应用中。它代表了 Gemini 的重大转变：从仅能回答问题的助手，转变为在用户指导下采取行动的代理。

自主行动与权限控制：Gemini Spark 可以帮助用户导航数字生活并代表用户采取行动。但所有操作均在用户指导下进行，用户可选择开启或关闭该功能。在执行高风险操作（如发送邮件或添加日历事件）前，Spark 会先征求用户同意。
Workspace 集成：Gemini Spark 在 Google Workspace 中的版本即将以预览形式面向商业客户开放。

关键要点

交互范式转变：Google Workspace 正从传统的点击式交互向语音驱动和代理式交互演进。Gmail Live、Docs Live 和 Keep 的语音功能强调“说即所得”，大幅降低内容创建和检索的认知负荷。
创意控制的精细化：Google Pics 的推出解决了 AI 图像生成中“难以微调”的痛点。通过对象分割和文本内嵌编辑，它赋予了用户类似专业设计软件的控制力，同时保留了 AI 生成的效率。
AI 代理的落地：Gemini Spark 标志着 Google AI 从“信息助手”向“行动助手”的关键跨越。通过引入“人在回路”（Human-in-the-loop）的安全机制（如高风险操作前确认），Google 试图在自动化效率与用户控制权之间找到平衡。
分层发布策略：新功能并非对所有用户同步开放，而是采取了分阶段、分层级的策略。通常先面向高价值订阅用户（Ultra/Pro）和测试员，再逐步扩展至商业客户和普通用户，以确保服务稳定性和收集反馈。
生态闭环强化：无论是 Docs Live 调用 Drive 数据，还是 Pics 集成到 Slides，亦或是 Gemini Spark 连接 Workspace 应用，所有新功能都旨在强化 Google Workspace 内部的协同效应，减少用户在不同应用间切换的成本。

意义与影响

此次更新反映了 Google 在 AI 生产力工具领域的战略深化。首先，语音交互的普及意味着办公场景将更加碎片化和移动化，用户可以在驾驶、通勤等无法使用键盘鼠标的场景下完成复杂任务，极大地拓展了 Workspace 的使用边界。

其次，Google Pics 的出现表明 Google 正在积极切入专业创意市场。通过提供精确的编辑控制，Google 试图证明 AI 不仅是创意的起点，也可以是精细制作的工具，从而与 Adobe 等传统创意软件形成差异化竞争。

最后，Gemini Spark 作为个人 AI 代理的推出，预示着未来办公软件的核心竞争力将从“功能丰富度”转向“自动化执行力”。如果用户能够信任 AI 代理代为处理邮件、安排日程等常规事务，那么 Workspace 将不再仅仅是一个工具集，而是一个真正懂用户、能替用户工作的智能中枢。这对于提升企业员工的整体工作效率，以及重塑人机协作模式具有深远影响。

查看原文 →blog.google