技术博客arXiv cs.CL·2 小时前

RuleChef：用LLM生成可编辑的NLP任务规则

原标题：RuleChef: Grounding LLM Task Knowledge in Human-Editable Rules

速览

RuleChef是一个利用大语言模型生成可执行规则的框架，适用于文本分类、命名实体识别等NLP任务。规则基于任务描述和标注示例自动生成，随后通过额外示例和人工反馈不断迭代改进。LLM仅在学习阶段使用，生成规则并基于失败测量对规则进行修补，最终得到高效、确定且可检验的规则系统。该框架还能利用现有模型的输入输出对来引导规则生成，为AI辅助开发新规则提供可操作工具，具有显著实用意义。

AI 深度解读

背景

近年来，自然语言处理（NLP）任务如文本分类、命名实体识别（Named Entity Recognition，简称NER）和关系抽取等，受到大型语言模型（LLMs）的广泛应用。这些模型通过大规模预训练和少样本学习展现出强大的泛化能力，但它们往往缺乏可解释性，且其内部知识难以直接被人类理解或编辑。传统规则系统虽具有确定性和可解释性，但构建和维护成本高昂。随着LLMs在生成能力上的突破，研究者开始探索如何将LLM的知识“接地”到人类可编辑的规则之上，实现更高效、可控的NLP解决方案。这一趋势直接催生了RuleChef框架的出现。

核心内容

RuleChef是一个利用大型语言模型（LLMs）为NLP任务生成可执行规则的框架。它适用于文本分类、命名实体识别（NER）或关系抽取等任务。规则的生成过程基于任务描述和一组带标签的示例进行。然后，规则会根据额外示例和对现有规则的人类反馈进行迭代改进。

RuleChef还可以利用任何现有模型在给定任务中观察到的输入-输出对来引导规则生成。LLMs仅在学习阶段使用：它们负责合成规则，并根据在保留分割上的失败度量进行迭代修补。最终产出的结果是一个快速、确定性且可检查的规则系统。

初步评估已在分类和NER任务上进行。作者已将RuleChef作为开源软件发布，许可协议为Apache 2.0。

关键要点

RuleChef使用LLMs根据任务描述和带标签示例生成可执行规则，适用于文本分类、NER和关系抽取。
规则生成后，通过额外示例和人类反馈进行迭代改进。
还可利用现有模型的输入-输出对引导规则引导生成。
LLMs仅在学习阶段参与，合成规则并基于保留分割上的失败度量迭代修补。
最终生成快速、确定性且可检查的规则系统。
初步评估覆盖分类和NER任务。
已开源发布，许可为Apache 2.0。

意义与影响

RuleChef为NLP领域提供了一种将LLM强大的知识与传统规则系统优势相结合的新路径。通过将LLM知识“接地”到人类可编辑的规则中，该框架实现了可解释性、可控性和确定性的平衡。未来，这种方法可能推动更高效、更透明的NLP系统在实际应用中的落地，并为研究者提供可扩展的工具来平衡模型规模与可维护性。

查看原文 →arxiv.org

RuleChef：用LLM生成可编辑的NLP任务规则

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐