← 返回信息流
技术博客arXiv cs.AI·3 小时前

LabGuard: Grounding Natural-Language Laboratory Rules into Runtime Guards for Embodied Laboratory Agents

AI 深度解读

背景

随着具身智能体(embodied agents)在科学实验领域的能力日益增强,它们已经能够执行复杂的实验室操作流程。然而,在动态变化的实验室环境中,如何安全地执行这些流程,仍然是一个巨大的挑战。当前的安全防护方法普遍忽视了一个关键的中间步骤:将实验室中以自然语言书写的安全规则、操作手册、实验方案和标准操作规程(SOPs),转化为机器可检查的运行时约束。这种缺失导致智能体在执行任务时,难以实时、自动地验证其行为是否符合安全规范,从而可能引发不安全事件。

核心内容

本文提出了 LabGuard(Laboratory Guard),这是一个“语言到执行”(language-to-execution)的安全套件,旨在将自然语言形式的实验室规则转化为可执行规范,并将其部署为运行时守卫。LabGuard 的核心设计包含三个组件和一个处理流水线:

  1. LabGuard-IR:定义了一个类型化的可执行表示(Intermediate Representation, IR)。这个 IR 是连接自然语言规则与机器可执行代码之间的桥梁,为实验室规则提供了一种结构化、规范化的描述方式。
  2. LabGuard-Bench:提供了一个包含 812 条监督标注的基准测试集,这些标注由 203 条种子实验室规则扩展而来。该基准用于评估和训练规则映射模型。
  3. LabGuard-Grounder:这是一个映射器,负责将自然语言的实验室规则转换为 LabGuard-IR 实例。它是实现从人类可读规则到机器可执行规范自动转换的关键。

由 LabGuard-Grounder 生成的 IR 实例,随后被送入 LabGuard Pipeline 进行处理。该流水线将这些 IR 编译成运行时监控器(runtime monitors),并在控制器边界(controller boundary)部署应用,从而在智能体执行任务的过程中实时检查其行为是否符合安全规则。

实验结果表明,LabGuard 具有良好的泛化能力,能够处理来自未见过的实验室规则来源。在任务范围 F1 值上达到了 79.4。在将规则编译为监控器后,不安全事件的发生率从 39.5% 显著降低至 23.8%。此外,在模拟环境 LabUtopia 中,其运行时监控器与 ACT 集成后,在保持任务成功率的同时,将干预率控制在 0.5% 以下。

关键要点

  • 问题聚焦:现有具身智能体安全方法忽略了将自然语言实验室规则转化为机器可检查的运行时约束这一关键中间步骤。
  • 核心方案:提出 LabGuard 套件,通过“自然语言规则 -> LabGuard-IR -> 运行时监控器”的流程,实现规则的自动转化与部署。
  • 三大组件
    • LabGuard-IR:提供可执行的中间表示。
    • LabGuard-Bench:提供 812 条标注数据,用于评估。
    • LabGuard-Grounder:实现从自然语言到 IR 的映射。
  • 处理流水线:LabGuard Pipeline 负责将 IR 编译成运行时监控器,并在控制器边界应用。
  • 实验效果
    • 对未见过的规则来源具有泛化能力。
    • 任务范围 F1 达到 79.4。
    • 不安全事件从 39.5% 降至 23.8%。
    • 在 LabUtopia 中与 ACT 集成,干预率低于 0.5%,且不影响任务成功。

意义与影响

LabGuard 的工作为具身智能体在真实、动态的实验室环境中的安全部署提供了一个系统性的解决方案。它不仅仅是一个静态的规则库,而是一个能够动态理解、转化并实时执行安全规范的生命周期套件。通过将模糊的自然语言规则固化为精确的、可执行的运行时守卫,LabGuard 显著降低了智能体操作中的安全风险。这项工作有望成为未来自动化实验室安全基础设施的关键组成部分,推动科学具身智能体从受控演示走向可靠、安全的实际应用。

查看原文 →arxiv.org