DiARC:区分正负样本提升大模型类ARC推理能力
速览
针对大模型在ARC类任务中表现不佳且闭源模型成本高昂的问题,研究提出DiARC方法。该方法借鉴偏好对齐思想,通过输出级视觉变换、DSL规则反转及任务规则编辑三种方式构建负样本,使模型能区分正负样本。实验表明,DiARC能显著提升基线模型在多个基准上的表现。
AI 深度解读
DiARC:区分正负样本有助于提升大语言模型的 ARC 类推理能力
背景
抽象与推理语料库(Abstraction and Reasoning Corpus, 简称 ARC)由 François Chollet 提出,旨在衡量人工智能的通用智能水平。ARC 包含一系列任务,要求模型从有限的网格样本中总结规律,并预测输出网格。这种任务类似于人类在解决智力测验题时的思维过程,强调少样本下的模式归纳与逻辑推理。
近年来,随着大语言模型(LLMs)的兴起,许多研究尝试将 ARC 任务转化为基于文本的推理任务,以利用 LLM 强大的上下文学习能力。然而,这一领域面临两大瓶颈:
- 开源模型表现不佳:基于开源 LLM 的方法通常难以达到令人满意的效果,缺乏足够的推理深度。
- 闭源模型成本高昂:依赖 GPT-4 等闭源模型虽然效果较好,但推理成本极高,难以规模化应用。
当前的主流改进思路主要集中在数据增强(Data Augmentation)上,即通过构造更多的 ARC 类数据来进行全面的监督微调(SFT)。然而,本文作者认为,仅靠增加正样本数量并不足以根本解决推理能力的瓶颈。解决 ARC 类问题的关键,不仅在于对“正确答案”(正样本)的监督,更在于模型需要具备区分“错误答案”(负样本)的能力,从而通过对比学习来优化推理路径。
核心内容
针对上述痛点,本文提出了一种名为 DiARC 的新方法。该方法借鉴了偏好对齐(Preference Alignment)的思想,旨在通过构建正负样本对(Preference Pairs),使模型学会区分正确与错误的推理结果。
1. 核心理念:正负样本对比
传统的微调通常只关注如何让模型生成正确的输出(正样本)。DiARC 认为,引入负样本监督可以迫使模型更深入地理解任务规则,识别出哪些推理路径是“似是而非”的错误陷阱。通过让模型在正样本和负样本之间做出区分,可以显著提升其推理的鲁棒性和准确性。
2. 负样本构造策略
为了构建高质量的负样本,DiARC 提出了三种具体的构造方法,这些方法在保持观察到的演示(demonstrations)不变的前提下,生成了具有信息量的“近失”(near-miss)替代方案:
-
输出级视觉变换(Output-level Visual Transformations): 直接在最终输出的网格层面进行视觉上的修改或扰动。例如,改变颜色、移动物体位置或翻转网格。这些变换生成的样本在视觉上与正确答案相似,但逻辑上是错误的,迫使模型关注更深层的结构而非表面特征。
-
DSL 级规则反转(DSL-level Rule Inversion): ARC 任务通常可以用领域特定语言(Domain Specific Language, DSL)来描述其背后的逻辑规则。该方法通过反转或修改 DSL 中的关键规则来生成负样本。例如,如果正确规则是“将红色方块向右移动”,负样本可能基于“将红色方块向左移动”或“不移动”的规则生成。这直接针对模型的逻辑推理核心进行干扰训练。
-
任务特定规则编辑(Task-specific Rule Editing): 针对特定类型的 ARC 任务,手动或半自动地编辑其特定的推理规则。这种方法能够生成更具针对性的错误示例,帮助模型识别特定任务类型中的常见错误模式。
3. 方法流程
- 数据准备:选取 ARC 任务及其对应的正样本(正确输入-输出对)。
- 负样本生成:利用上述三种策略,为每个正样本生成多个高质量的负样本。
- 偏好对齐训练:构建包含正样本和负样本的对子,使用偏好优化算法(如 DPO 或类似方法)对基座模型进行微调,使模型赋予正样本更高的概率,负样本更低的概率。
关键要点
- 创新视角:突破了仅依赖数据增强和正样本监督的传统范式,引入负样本区分能力作为提升 LLM 推理能力的关键因素。
- 三种负样本构造器:
- 视觉变换:从感知层面制造混淆。
- DSL 规则反转:从逻辑层面制造矛盾。
- 规则编辑:从任务语义层面制造偏差。
- 保持演示不变:所有负样本的构造均基于相同的输入演示,确保模型是在同一上下文约束下进行对比学习,避免了分布偏移问题。
- 通用性:该方法不依赖于特定的闭源模型,适用于开源 LLM 的微调优化。
意义与影响
DiARC 的研究成果在多个 ARC 类基准测试中均显示出对基线模型性能的持续提升。其意义主要体现在以下几个方面:
- 降低对闭源模型的依赖:通过优化开源模型的推理能力,DiARC 为低成本、高效率地解决复杂推理任务提供了可行路径,减少了对昂贵闭源 API 的依赖。
- 深化对“推理”的理解:研究证实,区分错误答案的能力与生成正确答案的能力同等重要。这为后续的大模型训练提供了新的指导方向——即在微调阶段应更加重视负样本的质量和多样性。
- 推动 ARC 任务的文本化进展:随着更多基于 LLM 的方法能够有效地处理 ARC 类任务,我们将更接近实现真正的通用人工智能(AGI)所需的抽象与推理能力。
代码已开源,便于社区复现和进一步研究。
