← 返回信息流
技术博客arXiv cs.CL·3 小时前

可执行模式契约:从自动数据摄入到多源检索

原标题:Executable Schema Contracts: From Automatic Ingestion to Multi-Source Retrieval

速览

针对现实世界中多源异构数据的语义整合难题,该系统能自动从原始数据中发现可执行模式,并将其作为构建知识图谱和查询检索的共享契约。通过约束LLM发现、确定性结构分析及溯源感知图谱构建,系统实现了高效的数据抽取与去重。在零样本对比实验中,该模式条件路由机制在多个问答基准上优于仅检索或分解基线,验证了结构智能与模式引导构建的有效性。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org