技术博客arXiv cs.CL·3 小时前

DiARC：区分正负样本提升大模型类ARC推理能力

原标题：\textsc{DiARC}: Distinguishing Positive and Negative Samples Helps Improving ARC-like Reasoning Ability of Large Language Models

速览

针对大模型在ARC类任务中表现不佳且闭源模型成本高昂的问题，研究提出DiARC方法。该方法借鉴偏好对齐思想，通过输出级视觉变换、DSL规则反转及任务规则编辑三种方式构建负样本，使模型能区分正负样本。实验表明，DiARC能显著提升基线模型在多个基准上的表现。

AI 深度解读

DiARC：区分正负样本有助于提升大语言模型的 ARC 类推理能力

背景

抽象与推理语料库（Abstraction and Reasoning Corpus, 简称 ARC）由 François Chollet 提出，旨在衡量人工智能的通用智能水平。ARC 包含一系列任务，要求模型从有限的网格样本中总结规律，并预测输出网格。这种任务类似于人类在解决智力测验题时的思维过程，强调少样本下的模式归纳与逻辑推理。

近年来，随着大语言模型（LLMs）的兴起，许多研究尝试将 ARC 任务转化为基于文本的推理任务，以利用 LLM 强大的上下文学习能力。然而，这一领域面临两大瓶颈：

开源模型表现不佳：基于开源 LLM 的方法通常难以达到令人满意的效果，缺乏足够的推理深度。
闭源模型成本高昂：依赖 GPT-4 等闭源模型虽然效果较好，但推理成本极高，难以规模化应用。

当前的主流改进思路主要集中在数据增强（Data Augmentation）上，即通过构造更多的 ARC 类数据来进行全面的监督微调（SFT）。然而，本文作者认为，仅靠增加正样本数量并不足以根本解决推理能力的瓶颈。解决 ARC 类问题的关键，不仅在于对“正确答案”（正样本）的监督，更在于模型需要具备区分“错误答案”（负样本）的能力，从而通过对比学习来优化推理路径。

核心内容

针对上述痛点，本文提出了一种名为 DiARC 的新方法。该方法借鉴了偏好对齐（Preference Alignment）的思想，旨在通过构建正负样本对（Preference Pairs），使模型学会区分正确与错误的推理结果。

1. 核心理念：正负样本对比

传统的微调通常只关注如何让模型生成正确的输出（正样本）。DiARC 认为，引入负样本监督可以迫使模型更深入地理解任务规则，识别出哪些推理路径是“似是而非”的错误陷阱。通过让模型在正样本和负样本之间做出区分，可以显著提升其推理的鲁棒性和准确性。

2. 负样本构造策略

为了构建高质量的负样本，DiARC 提出了三种具体的构造方法，这些方法在保持观察到的演示（demonstrations）不变的前提下，生成了具有信息量的“近失”（near-miss）替代方案：

输出级视觉变换（Output-level Visual Transformations）：直接在最终输出的网格层面进行视觉上的修改或扰动。例如，改变颜色、移动物体位置或翻转网格。这些变换生成的样本在视觉上与正确答案相似，但逻辑上是错误的，迫使模型关注更深层的结构而非表面特征。
DSL 级规则反转（DSL-level Rule Inversion）： ARC 任务通常可以用领域特定语言（Domain Specific Language, DSL）来描述其背后的逻辑规则。该方法通过反转或修改 DSL 中的关键规则来生成负样本。例如，如果正确规则是“将红色方块向右移动”，负样本可能基于“将红色方块向左移动”或“不移动”的规则生成。这直接针对模型的逻辑推理核心进行干扰训练。
任务特定规则编辑（Task-specific Rule Editing）：针对特定类型的 ARC 任务，手动或半自动地编辑其特定的推理规则。这种方法能够生成更具针对性的错误示例，帮助模型识别特定任务类型中的常见错误模式。

3. 方法流程

数据准备：选取 ARC 任务及其对应的正样本（正确输入-输出对）。
负样本生成：利用上述三种策略，为每个正样本生成多个高质量的负样本。
偏好对齐训练：构建包含正样本和负样本的对子，使用偏好优化算法（如 DPO 或类似方法）对基座模型进行微调，使模型赋予正样本更高的概率，负样本更低的概率。

关键要点

创新视角：突破了仅依赖数据增强和正样本监督的传统范式，引入负样本区分能力作为提升 LLM 推理能力的关键因素。
三种负样本构造器：
- 视觉变换：从感知层面制造混淆。
- DSL 规则反转：从逻辑层面制造矛盾。
- 规则编辑：从任务语义层面制造偏差。
保持演示不变：所有负样本的构造均基于相同的输入演示，确保模型是在同一上下文约束下进行对比学习，避免了分布偏移问题。
通用性：该方法不依赖于特定的闭源模型，适用于开源 LLM 的微调优化。

意义与影响

DiARC 的研究成果在多个 ARC 类基准测试中均显示出对基线模型性能的持续提升。其意义主要体现在以下几个方面：

降低对闭源模型的依赖：通过优化开源模型的推理能力，DiARC 为低成本、高效率地解决复杂推理任务提供了可行路径，减少了对昂贵闭源 API 的依赖。
深化对“推理”的理解：研究证实，区分错误答案的能力与生成正确答案的能力同等重要。这为后续的大模型训练提供了新的指导方向——即在微调阶段应更加重视负样本的质量和多样性。
推动 ARC 任务的文本化进展：随着更多基于 LLM 的方法能够有效地处理 ARC 类任务，我们将更接近实现真正的通用人工智能（AGI）所需的抽象与推理能力。

代码已开源，便于社区复现和进一步研究。

查看原文 →arxiv.org