技术博客arXiv cs.AI·7 小时前

DeXposure-Claw：基于预测的DeFi风险监管智能体系统

原标题：DeXposure-Claw: An Agentic System for DeFi Risk Supervision

速览

针对去中心化金融中信用风险传播快、通用LLM易误报的问题，研究团队提出DeXposure-Claw智能体监管系统。该系统通过图时间序列基础模型DeXposure-FM预测未来风险网络，并结合确定性监控与压力测试生成结构化证据，最终输出带理由的可审计监管工单。实验基于五年真实数据验证了系统有效性，并发布了包含六轴评估的DeXposure-Bench基准。

AI 深度解读

DeXposure-Claw：基于代理系统的 DeFi 风险监管新范式

背景

去中心化金融（DeFi）的兴起彻底改变了金融基础设施的形态，但也引入了传统金融体系中未曾面临的新型风险特征。与中心化金融（CeFi）不同，DeFi 协议之间的交互高度互联且自动化执行，导致信用风险在网络中迅速传导。这种“快速移动、网络化”的风险特征，使得传统的静态监控手段难以应对。

与此同时，业界尝试引入通用大型语言模型（LLM）代理（Agentic Systems）来辅助监管。然而，通用 LLM 在此类高风险、高动态场景中表现不佳：它们倾向于过度解读微弱的证据，从而建议采取高风险的干预措施。更严重的是，现有的评估体系缺乏与监管机构对齐的标准，无法有效衡量由此产生的“误报”（False Alarms）及其带来的社会成本。

针对这一痛点，研究团队提出了 DeXposure-Claw，这是一个以预测为根基的代理式监管系统。该系统旨在通过结构化的证据链来约束 LLM 的决策过程，从而在保持自动化效率的同时，显著降低误报率，并提供符合监管审计要求的风险预警。

核心内容

DeXposure-Claw 的核心创新在于构建了一个“预测驱动、结构化证据、多重门控”的闭环监管流程。该系统并非直接让 LLM 做出判断，而是通过以下三个关键步骤将 LLM 的决策置于严格的证据约束之下：

1. 基础模型预测：DeXposure-FM

系统首先利用 DeXposure-FM，这是一个基于图时间序列的基础模型（Graph Time-Series Foundation Model）。该模型负责预测未来的风险暴露网络（Exposure Networks）。通过捕捉协议间复杂的拓扑结构和时间动态，DeXposure-FM 能够预判潜在的风险传导路径，为后续分析提供前瞻性的数据基础。

2. 确定性监控与场景推演

基于 DeXposure-FM 的预测结果，系统引入确定性监控器（Deterministic Monitors）和压力测试场景（Stress Scenarios）。这一阶段将模糊的预测转化为具体的、类型化的输出：

类型化警报（Typed Alerts）：明确风险类别。
归因信号（Attribution Signals）：指出风险来源。
场景证据（Scenario Evidence）：提供具体的压力测试数据支持。

这一步骤至关重要，它将 LLM 需要处理的非结构化或半结构化信息转化为结构化证据，减少了 LLM 的幻觉空间。

3. 数据健康度与置信度门控

在发出最终监管工单之前，DeXposure-Claw 设置了双重门控机制：

数据健康度门控（Data-Health Gate）：确保输入数据的质量可靠。
置信度门控（Confidence Gate）：评估当前证据链的充分性。

只有当数据质量和模型置信度均满足阈值时，系统才会触发 LLM 生成最终的、可审计的监管工单（Supervisory Tickets），并附带详细的推理依据（Rationales）。这种设计有效遏制了 LLM 在证据不足时的过度干预冲动。

评估体系：DeXposure-Bench

为了科学评估该系统，研究团队开发了 DeXposure-Bench，这是一个包含六个维度的评估框架。其中，“决策轴（Decision Axis）”是核心评估指标，它通过以下方式对监管工单进行打分：

监管对齐的绝对损失基准（Regulator-Aligned Absolute-Loss Ground Truth）：衡量干预措施是否符合监管利益。
明确的错误干预率（Explicit False-Intervention Rate）：量化误报带来的负面影响。

实验基于五年每周的真实 DeFi 数据进行了验证，结果充分支持了 DeXposure-Claw 在降低误报、提高监管有效性方面的优势。

关键要点

问题驱动：通用 LLM 在 DeFi 监管中容易因过度解读弱证据而导致高成本的错误干预，且缺乏监管对齐的评估标准。
架构创新：DeXposure-Claw 采用“预测+结构化证据+门控”的三阶段架构，将 LLM 从“决策者”转变为“基于证据的推理者”。
核心技术组件：
- DeXposure-FM：图时间序列基础模型，用于预测风险暴露网络。
- 确定性监控器：将预测转化为具体的警报、归因和场景证据。
- 双重门控机制：通过数据健康度和置信度检查，限制不必要的升级和误报。
可审计性：系统生成的监管工单包含完整的推理依据（Rationales），满足金融监管对透明度和可追溯性的要求。
评估基准：提出的 DeXposure-Bench 引入了“错误干预率”和“监管对齐损失”作为关键指标，填补了该领域评估标准的空白。
实证支持：基于五年真实周度数据的实验证明，该系统能有效平衡风险识别与误报控制。

意义与影响

DeXposure-Claw 的提出标志着 AI 在金融监管领域的应用从“通用智能尝试”向“垂直领域可信系统”的转变。

首先，它解决了 LLM 在高风险决策中的“幻觉”与“过度自信”问题。通过引入结构化证据和确定性监控，系统迫使 AI 在做出干预建议前必须提供可验证的数据支撑，这极大地提高了监管决策的可信度。

其次，该工作为 DeFi 监管提供了可操作的工程化方案。DeFi 的匿名性和复杂性使得传统人工监管难以跟上市场变化，而 DeXposure-Claw 展示了一种自动化、可扩展且符合监管逻辑的技术路径。

最后，DeXposure-Bench 评估框架的建立，为后续研究提供了标准化的衡量尺度。通过明确“错误干预率”的重要性，该研究提醒业界：在金融监管 AI 中，减少误报（False Positives）与提高检测率同样重要，甚至更为关键，因为错误的监管干预本身就会对市场造成实质性损害。

随着 DeFi 规模的扩大，此类结合预测模型、结构化推理和严格门控机制的 Agentic 系统，有望成为未来去中心化金融基础设施中不可或缺的“数字监管员”。

查看原文 →arxiv.org