← 返回信息流
技术博客arXiv cs.AI·7 小时前

DeXposure-Claw:基于预测的DeFi风险监管智能体系统

原标题:DeXposure-Claw: An Agentic System for DeFi Risk Supervision

速览

针对去中心化金融中信用风险传播快、通用LLM易误报的问题,研究团队提出DeXposure-Claw智能体监管系统。该系统通过图时间序列基础模型DeXposure-FM预测未来风险网络,并结合确定性监控与压力测试生成结构化证据,最终输出带理由的可审计监管工单。实验基于五年真实数据验证了系统有效性,并发布了包含六轴评估的DeXposure-Bench基准。

AI 深度解读

DeXposure-Claw:基于代理系统的 DeFi 风险监管新范式

背景

去中心化金融(DeFi)的兴起彻底改变了金融基础设施的形态,但也引入了传统金融体系中未曾面临的新型风险特征。与中心化金融(CeFi)不同,DeFi 协议之间的交互高度互联且自动化执行,导致信用风险在网络中迅速传导。这种“快速移动、网络化”的风险特征,使得传统的静态监控手段难以应对。

与此同时,业界尝试引入通用大型语言模型(LLM)代理(Agentic Systems)来辅助监管。然而,通用 LLM 在此类高风险、高动态场景中表现不佳:它们倾向于过度解读微弱的证据,从而建议采取高风险的干预措施。更严重的是,现有的评估体系缺乏与监管机构对齐的标准,无法有效衡量由此产生的“误报”(False Alarms)及其带来的社会成本。

针对这一痛点,研究团队提出了 DeXposure-Claw,这是一个以预测为根基的代理式监管系统。该系统旨在通过结构化的证据链来约束 LLM 的决策过程,从而在保持自动化效率的同时,显著降低误报率,并提供符合监管审计要求的风险预警。

核心内容

DeXposure-Claw 的核心创新在于构建了一个“预测驱动、结构化证据、多重门控”的闭环监管流程。该系统并非直接让 LLM 做出判断,而是通过以下三个关键步骤将 LLM 的决策置于严格的证据约束之下:

1. 基础模型预测:DeXposure-FM

系统首先利用 DeXposure-FM,这是一个基于图时间序列的基础模型(Graph Time-Series Foundation Model)。该模型负责预测未来的风险暴露网络(Exposure Networks)。通过捕捉协议间复杂的拓扑结构和时间动态,DeXposure-FM 能够预判潜在的风险传导路径,为后续分析提供前瞻性的数据基础。

2. 确定性监控与场景推演

基于 DeXposure-FM 的预测结果,系统引入确定性监控器(Deterministic Monitors)和压力测试场景(Stress Scenarios)。这一阶段将模糊的预测转化为具体的、类型化的输出:

  • 类型化警报(Typed Alerts):明确风险类别。
  • 归因信号(Attribution Signals):指出风险来源。
  • 场景证据(Scenario Evidence):提供具体的压力测试数据支持。

这一步骤至关重要,它将 LLM 需要处理的非结构化或半结构化信息转化为结构化证据,减少了 LLM 的幻觉空间。

3. 数据健康度与置信度门控

在发出最终监管工单之前,DeXposure-Claw 设置了双重门控机制:

  • 数据健康度门控(Data-Health Gate):确保输入数据的质量可靠。
  • 置信度门控(Confidence Gate):评估当前证据链的充分性。

只有当数据质量和模型置信度均满足阈值时,系统才会触发 LLM 生成最终的、可审计的监管工单(Supervisory Tickets),并附带详细的推理依据(Rationales)。这种设计有效遏制了 LLM 在证据不足时的过度干预冲动。

评估体系:DeXposure-Bench

为了科学评估该系统,研究团队开发了 DeXposure-Bench,这是一个包含六个维度的评估框架。其中,“决策轴(Decision Axis)”是核心评估指标,它通过以下方式对监管工单进行打分:

  • 监管对齐的绝对损失基准(Regulator-Aligned Absolute-Loss Ground Truth):衡量干预措施是否符合监管利益。
  • 明确的错误干预率(Explicit False-Intervention Rate):量化误报带来的负面影响。

实验基于五年每周的真实 DeFi 数据进行了验证,结果充分支持了 DeXposure-Claw 在降低误报、提高监管有效性方面的优势。

关键要点

  • 问题驱动:通用 LLM 在 DeFi 监管中容易因过度解读弱证据而导致高成本的错误干预,且缺乏监管对齐的评估标准。
  • 架构创新:DeXposure-Claw 采用“预测+结构化证据+门控”的三阶段架构,将 LLM 从“决策者”转变为“基于证据的推理者”。
  • 核心技术组件
    • DeXposure-FM:图时间序列基础模型,用于预测风险暴露网络。
    • 确定性监控器:将预测转化为具体的警报、归因和场景证据。
    • 双重门控机制:通过数据健康度和置信度检查,限制不必要的升级和误报。
  • 可审计性:系统生成的监管工单包含完整的推理依据(Rationales),满足金融监管对透明度和可追溯性的要求。
  • 评估基准:提出的 DeXposure-Bench 引入了“错误干预率”和“监管对齐损失”作为关键指标,填补了该领域评估标准的空白。
  • 实证支持:基于五年真实周度数据的实验证明,该系统能有效平衡风险识别与误报控制。

意义与影响

DeXposure-Claw 的提出标志着 AI 在金融监管领域的应用从“通用智能尝试”向“垂直领域可信系统”的转变。

首先,它解决了 LLM 在高风险决策中的“幻觉”与“过度自信”问题。通过引入结构化证据和确定性监控,系统迫使 AI 在做出干预建议前必须提供可验证的数据支撑,这极大地提高了监管决策的可信度。

其次,该工作为 DeFi 监管提供了可操作的工程化方案。DeFi 的匿名性和复杂性使得传统人工监管难以跟上市场变化,而 DeXposure-Claw 展示了一种自动化、可扩展且符合监管逻辑的技术路径。

最后,DeXposure-Bench 评估框架的建立,为后续研究提供了标准化的衡量尺度。通过明确“错误干预率”的重要性,该研究提醒业界:在金融监管 AI 中,减少误报(False Positives)与提高检测率同样重要,甚至更为关键,因为错误的监管干预本身就会对市场造成实质性损害。

随着 DeFi 规模的扩大,此类结合预测模型、结构化推理和严格门控机制的 Agentic 系统,有望成为未来去中心化金融基础设施中不可或缺的“数字监管员”。

查看原文 →arxiv.org