← 返回信息流
技术博客Google AI Blog·2026/5/4

在 Gemini API 中使用 Webhooks 降低长任务运行的摩擦与延迟

原标题:Reduce friction and latency for long-running jobs with Webhooks in Gemini API

速览

Gemini API 新增事件驱动 Webhooks 功能,这是一种基于推送的通知系统。它消除了传统轮询机制带来的低效与高延迟问题。该功能旨在优化长运行任务的执行体验,减少资源摩擦并提升响应速度。

AI 深度解读

Gemini API 引入 Webhooks:降低长任务延迟与摩擦

背景

随着 Gemini 模型逐渐向智能体(Agentic)工作流和高吞吐量处理场景演进,应用开发的复杂性正在显著提升。诸如 Deep Research(深度研究)、长视频生成,或通过 Batch API 批量处理数千个提示词等任务,往往需要数分钟甚至数小时才能完成。

在过去,开发者在处理这类长运行任务时,不得不依赖低效的轮询机制(Polling)。这意味着客户端需要不断地、重复地调用 GET 操作来检查任务状态,直到任务完成。这种模式不仅增加了网络开销和服务器负载,还引入了不必要的延迟和摩擦,阻碍了实时交互体验的构建。

核心内容

为了解决上述痛点,Google 在 Gemini API 中引入了基于事件驱动的 Webhooks 功能。这是一种“推送式”(Push-based)的通知系统,旨在彻底消除对低效轮询的需求。

1. 实时推送机制 现在,一旦任务完成,Gemini API 会立即通过 HTTP POST 请求将实时负载(payload)推送至开发者的服务器。这种机制将传统的“拉取”模式转变为“推送”模式,显著降低了延迟。

2. 安全性与可靠性设计 该功能的实现严格遵循标准 Webhooks 规范,并重点考虑了安全性和可靠性:

  • 身份验证与防重放攻击:每个请求都包含 webhook-signaturewebhook-idwebhook-timestamp 标头。这些标头确保了请求的幂等性(Idempotency),并有效防止重放攻击。
  • 至少一次交付保证:系统提供自动重试机制,确保在长达 24 小时内实现“至少一次”(at-least-once)的消息投递,保障任务状态通知不丢失。

3. 灵活的配置方式 开发者可以根据需求选择两种配置层级:

  • 项目级全局配置:通过 HMAC 进行安全保护,适用于大多数常规场景。
  • 请求级动态覆盖:通过 JWKS(JSON Web Key Set)进行安全保护,允许在单个请求中动态覆盖 Webhook 设置,从而将特定任务路由到特定的端点。

4. 开发工具支持 Google 提供了 Python SDK 示例,展示了如何动态配置批量任务的 Webhook。同时,官方发布了详细的文档指南和综合性的 Cookbook(食谱),帮助开发者快速上手,构建端到端的 Webhook 集成。

关键要点

  • 消除轮询开销:Webhooks 取代了传统的轮询机制,开发者无需再编写循环代码去查询任务状态,降低了代码复杂性和服务器资源消耗。
  • 支持复杂长任务:特别针对 Deep Research、长视频生成及 Batch API 等高耗时场景优化,解决了分钟级至小时级任务的状态同步难题。
  • 企业级安全标准
    • 使用 webhook-signaturewebhook-idwebhook-timestamp 标头确保请求完整性和防重放。
    • 支持 HMAC(项目级)和 JWKS(请求级)两种认证方式,满足不同安全粒度的需求。
  • 高可靠性投递:提供长达 24 小时的自动重试机制,保证“至少一次”交付,防止因网络波动导致的通知丢失。
  • 即刻可用:该功能已面向所有使用 Gemini API 的开发者开放,并配有完整的文档和 Python SDK 示例供参考。

意义与影响

Gemini API 引入 Webhooks 是 AI 应用开发基础设施的一次重要升级。对于构建复杂智能体应用的开发者而言,这一改变具有深远意义:

  1. 提升开发效率与体验:开发者可以从繁琐的状态轮询代码中解脱出来,专注于业务逻辑本身。实时推送机制使得构建类似“实时协作”或“即时反馈”的应用成为可能,极大改善了终端用户的交互体验。
  2. 优化资源成本:通过消除无效的网络请求和轮询,显著降低了客户端和服务器的带宽及计算资源消耗,特别是在处理大规模批量任务时,成本效益更为明显。
  3. 推动 Agentic 工作流普及:长运行任务是智能体(Agent)执行复杂规划、研究和生成任务的核心特征。Webhooks 的加入为构建稳定、实时响应的 Agentic 应用提供了必要的底层支持,加速了 AI 从“单次问答”向“自主执行复杂任务”的能力演进。
  4. 标准化与安全性并重:遵循标准 Webhooks 规范并内置企业级安全机制,表明 Google 在推动 AI API 标准化和商业化落地方面的成熟度,有助于降低企业级客户集成 Gemini API 的安全顾虑和技术门槛。
查看原文 →blog.google