技术博客arXiv cs.AI·8 天前

Helicase：基于自主多智能体LLM的不确定性引导供应链知识图谱构建

原标题：Helicase: Uncertainty-Guided Supply Chain Knowledge Graph Construction with Autonomous Multi-Agent LLMs

速览

针对供应链中复杂的结构推理需求，提出Helicase自主多智能体LLM系统。该系统通过分解查询、协调多智能体迭代验证，增量构建带有不确定性标注的知识图谱。引入三层不确定性框架评估置信度，并发布SCQA基准以评估推理能力。

AI 深度解读

Helicase：基于自主多智能体大模型的供应链知识图谱构建

背景

随着大语言模型（LLM）和多智能体系统的兴起，基于 LLM 的多智能体系统已被广泛应用于知识检索和报告生成领域。这些系统通常通过网页搜索和文本推理来合成已知信息，在处理简单的单次查询任务时表现优异。

然而，供应链领域的许多关键信息任务并非简单的“一次性查询”。它们本质上是结构化的推理问题，需要在复杂且碎片化的网络资源中进行多跳推理（Multi-hop Reasoning）。例如，回答“哪些特斯拉组件使用了来自澳大利亚矿山的锂？”这类问题，无法在单一文档中找到现成答案。答案必须通过自主构建和分析动态知识图谱来计算合成，这些图谱由来自碎片化、异构来源的信息组装而成。

此外，这种发现过程必须具备“不确定性感知”（Uncertainty-aware）能力。决策不仅依赖于答案本身，更依赖于对答案可靠性的校准置信度，且这种置信度必须可追溯至源数据的质量和推理的一致性。现有的通用多智能体系统往往缺乏这种针对供应链复杂结构的深层推理和不确定性量化能力，构成了当前的技术缺口。

核心内容

为了解决上述能力缺口，研究人员提出了 Helicase，这是一个用于不确定性引导的供应链知识图谱构建的自主多智能体 LLM 系统。Helicase 的核心工作流程和架构设计如下：

1. 任务分解与执行计划

Helicase 能够将高层级的供应链查询分解为可执行的调查计划（Investigation Plans）。这意味着系统不会盲目地进行搜索，而是先规划出需要获取哪些数据、如何关联这些数据，以及需要验证哪些假设。

2. 多智能体协同与迭代验证

系统协调了多种专用的智能体角色，包括：

网络搜索智能体（Web-search Agents）：负责从互联网上抓取碎片化信息。
推理智能体（Reasoning Agents）：负责逻辑推导和多跳关联。
编码智能体（Coding Agents）：负责数据处理、图谱构建脚本编写及自动化操作。

这些智能体通过迭代验证循环（Iterative Verification Loops）进行协作。在构建过程中，系统会不断验证已获取信息的准确性和相关性，确保持续修正和优化。

3. 动态知识图谱构建与不确定性标注

Helicase 增量式地构建针对特定查询的供应链知识图谱。其关键创新在于为图谱中的每一个事实（Fact）都附带了不确定性注释（Uncertainty Annotations）。这使得最终输出的知识图谱不仅包含“是什么”，还包含“有多确定”。

4. 三层不确定性框架

Helicase 引入了一个三层不确定性框架，分别追踪不同层面的不确定性：

动作层（Action Layer）：评估单个操作（如一次搜索或一次推理步骤）的不确定性。
轨迹层（Trajectory Layer）：评估整个推理路径或决策序列的不确定性。
记忆层（Memory Layer）：评估存储在系统记忆中的事实或知识片段的不确定性。

这一框架使得系统既能进行复杂的结构推理，又能提供校准后的置信度评估，确保决策的可追溯性和可靠性。

5. 基准测试：SCQA

为了全面评估自主推理能力，研究团队引入了 SCQA（Supply Chain Query Assessment，供应链查询评估），这是一个包含 80 个供应链查询的基准数据集。SCQA 将查询划分为四个象限，涵盖了从单跳推理到多跳推理，以及高数据可见性到低数据可见性的完整复杂性光谱。

关键要点

解决多跳推理难题：Helicase 专为解决供应链中需要跨多个碎片化来源进行多跳推理的复杂问题而设计，超越了传统单次查询检索的局限。
不确定性感知决策：系统不仅提供答案，还提供经过校准的置信度。通过三层框架（动作、轨迹、记忆）量化不确定性，使决策基于对数据质量和推理一致性的深刻理解。
自主多智能体架构：采用搜索、推理、编码专用智能体的协同工作模式，通过迭代验证循环自动构建动态知识图谱。
增量式图谱构建：系统根据查询需求增量式地构建知识图谱，并为每个事实节点附加不确定性标签，实现细粒度的可信度评估。
标准化评估基准：提出的 SCQA 基准测试涵盖了不同复杂度（单跳至多跳）和数据可见性条件下的供应链查询，为衡量此类系统的推理能力提供了标准。

意义与影响

Helicase 的提出标志着 AI 在垂直领域深度应用上的重要进展，特别是在对准确性和可靠性要求极高的供应链管理中。

提升供应链透明度与韧性：通过自动构建和验证供应链知识图谱，企业可以更快速地识别关键组件来源、潜在瓶颈和替代方案，从而增强供应链的透明度和抗风险能力。
从“信息检索”到“知识发现”：Helicase 展示了 LLM 多智能体系统如何从被动的信息检索者转变为主动的知识发现者。它能够通过自主规划和推理，从海量非结构化数据中挖掘出隐含的结构化知识。
可信 AI 的实践范例：引入不确定性感知框架是解决大模型“幻觉”问题的重要尝试。在供应链决策中，知道“答案是什么”以及“我们对这个答案有多确定”同样重要。Helicase 为构建可信赖的自主 AI 系统提供了新的架构思路。
推动自动化尽职调查：对于需要处理复杂、异构数据源的行业（如金融尽职调查、合规审查、供应链审计），Helicase 的方法论具有广泛的借鉴意义，有望大幅降低人工调查的成本和时间。

查看原文 →arxiv.org