技术博客Google AI Blog·15 天前

Google Workspace 全新创建与高效办公方式

原标题：New ways to create and get things done in Google Workspace

速览

Google Workspace 宣布了一系列旨在提升效率的新功能。其中包括在 Gmail、Docs 和 Keep 中新增语音能力，以及一款名为 Google Pics 的全新设计工具。此外，AI 收件箱也迎来了重要更新，进一步优化用户的邮件处理体验。

AI 深度解读

Google Workspace 全新 AI 功能解读：从语音交互到自主智能体

背景

Google Workspace 拥有超过 40 亿用户，涵盖 Gmail、Docs 和 Drive 等核心应用，是全球用户进行内容创作、协作和日常办公的主要平台。随着人工智能技术的深入发展，Google 旨在通过引入更先进的 AI 能力，进一步提升用户在这些应用中的工作效率与创造力。

近日，Google AI Blog 宣布了一系列针对 Google AI 订阅用户及 Google Workspace 企业客户的新功能。这些更新不仅涵盖了语音交互、图像生成与编辑、邮件管理优化，还推出了全新的个人 AI 智能体 Gemini Spark。这些新功能旨在通过更自然的交互方式（如语音）和更精准的创作控制，帮助用户在数字生活中节省时间，专注于最重要的工作。

核心内容

本次更新主要围绕四大核心领域展开：语音能力的深化、图像创作工具 Google Pics 的发布、AI Inbox 功能的扩展以及 Gemini Spark 智能体的亮相。

1. 语音交互：让声音驱动工作流

Google 正在 Gmail、Docs 和 Keep 中引入新的对话式语音功能，旨在通过语音加速头脑风暴、思维整理和任务执行。

Gmail Live：这是一种语音激活的收件箱搜索与信息综合功能。用户无需手动翻阅邮件，只需通过语音提问（例如“我的航班登机口是多少？”或“我孩子学校这周有什么安排？”），Gmail Live 即可即时搜索收件箱并合成答案。
Docs Live：作为用户的思维伙伴和共同作者，Docs Live 允许用户仅通过语音快速生成初稿。它负责整理思路、构建文档结构，并在获得用户许可后，从 Gmail、Drive、Chat 及网络中提取相关细节。无论是意识流的倾诉还是创意 brainstorming，Docs Live 都能帮助用户梳理大纲、调整语调并无缝创作。
Keep 语音整理：在 Keep 中，用户现在可以通过“语音倾倒”（brain dump）的方式记录想法。Keep 不仅能理解用户的口语内容，还会在后台自动将其转化为结构化的笔记和列表。

2. Google Pics：基于 Nano Banana 模型的图像创作与编辑

Google Pics 是一款全新的图像生成与编辑应用，基于 Google 最新的 Nano Banana 模型构建。其核心理念是将 AI 图像生成从“掷骰子”式的随机生成转变为具有精准创意控制的创作过程。

对象分割与编辑：用户可以精确选择并编辑图像中的特定元素，如移动物体、调整大小或完全变换物体（例如将毛衣颜色改变，或将狗变成猫），且不影响图像其余部分。
文本编辑与翻译：支持直接在照片内部修改文本，或在保持原有设计和字体风格不变的情况下，将文本翻译成不同语言。
Workspace 集成：Pics 将与 Workspace 应用集成，用户可以直接在 Slides 和 Drive 中编辑图像，无需切换应用。
协作功能：提供可共享的画布，允许多人同时编辑同一张图像。

3. AI Inbox：邮件管理的智能化升级

AI Inbox 此前已在 Gmail 中推出，用于智能优先处理重要更新和紧急任务。此次更新将其扩展至 Google AI Plus 和 Pro 订阅用户，并增加了以下新功能：

个性化草稿回复：当需要快速回复邮件时，AI Inbox 不仅提醒用户，还会生成上下文相关的草稿，用户只需审阅即可在几秒内回复。
即时文件访问：当任务涉及审阅 Google Doc、Sheet 或 Slide 时，相关文件的链接会直接显示在待办事项旁边，无需在邮件线程中搜索。
简化的任务管理：用户可以通过单击标记单个任务为完成、忽略无用的建议，或将特定主题下的所有邮件标记为已读，从而保持视图整洁。

4. Gemini Spark：24/7 个人 AI 智能体

在 Google I/O 大会上公布的 Gemini Spark 是一个全天候的个人 AI 智能体，旨在帮助用户导航数字生活。它标志着 Gemini 从“回答问题”的助手向“在用户指导下采取行动”的智能体转变。

主动性与安全性：Spark 设计为在执行高风险操作（如发送邮件或添加日历事件）前必须先征得用户同意。用户可以选择开启或关闭该功能。
Workspace 集成：Gemini Spark 将在 Gemini 应用中预览版面向企业客户开放，并与 Workspace 应用深度集成，实现跨应用的自动化操作。

关键要点

语音优先的交互体验：Gmail Live、Docs Live 和 Keep 的语音功能允许用户通过自然语言进行邮件搜索、文档起草和笔记整理，大幅降低了输入门槛，提升了“边说边做”的效率。
精准的图像控制权：Google Pics 基于 Nano Banana 模型，解决了传统 AI 图像生成难以进行局部微调的痛点。其对象分割、文本内嵌编辑和翻译功能，使其适用于从专业设计到日常创意项目的广泛场景。
AI Inbox 的普及与增强：AI Inbox 的功能从 Ultra 订阅用户扩展至 Plus 和 Pro 用户（美国地区），并通过个性化回复、即时文件链接和任务管理优化，进一步减少了邮件处理中的认知负荷。
从助手到智能体的转变：Gemini Spark 代表了 AI 交互范式的转变，它不再仅仅是被动回答问题的工具，而是一个可以在用户授权下主动执行任务、整合数字生活的智能体。
发布节奏：
- 语音功能：夏季向 Google AI Pro/Ultra 用户推出，并向 Workspace 企业客户预览。
- Google Pics：今日向受信任测试者有限开放，夏季向全球 Google AI Pro/Ultra 用户推出，并向 Workspace 企业客户预览。
- AI Inbox：目前对 Ultra 用户可用，今日开始向美国地区的 Plus 和 Pro 用户扩展。
- Gemini Spark：将在 Gemini 应用中尽快向企业客户预览。

意义与影响

此次更新标志着 Google Workspace 正在从“工具集合”向“智能工作流平台”演进。

首先，交互范式的多元化显著提升了生产力。通过引入语音交互（Gmail Live, Docs Live），Google 解放了用户的双手和眼睛，使得在移动场景或多任务处理下获取信息和创作内容变得更加高效。这种“所想即所得，所说即所写”的体验，降低了数字创作的技术门槛。

其次，创意工作的可控性得到加强。Google Pics 的推出填补了 AI 图像生成在专业工作流中的空白。通过提供对象级编辑和文本处理能力，它使得 AI 生成的图像不再是最终的“成品”，而是可进一步精修的“素材”，这对于设计师、营销人员以及需要制作高质量视觉内容的普通用户具有重要意义。

最后，AI 智能体的自主性引发了对数字工作边界的新思考。Gemini Spark 的出现意味着 AI 开始承担更多执行性任务。虽然其设计强调用户主导和安全确认，但这预示着未来的办公软件将更加注重跨应用的自动化协同。对于企业用户而言，这意味着工作流程的自动化程度将大幅提升，但也要求用户建立新的数字卫生习惯，以管理 AI 智能体的权限和行为。

总体而言，这些功能不仅增强了现有 Workspace 应用的粘性，也为 Google 在 AI 原生办公领域的竞争奠定了坚实基础，旨在帮助用户从繁琐的数字琐事中解脱出来，回归高价值的创造性工作。

查看原文 →blog.google