技术博客arXiv cs.AI·2 小时前

DiBS：利用扩散模型指导分支选择加速数独求解

原标题：DiBS: Diffusion-Informed Branch Selection

速览

针对传统启发式和深度学习求解器在数独求解中的局限性，研究提出DiBS方法。该方法利用扩散模型作为分支排序引导，在保持符号求解器完备性的同时优化候选值排名。实验表明，DiBS在Royle 17线索基准测试中大幅减少了搜索节点和回溯次数，有效提升了难实例的求解效率。

数独（Sudoku）作为约束满足问题（Constraint Satisfaction Problem, CSP）的经典代表，其核心难点在于需要在严格的离散约束条件下进行全局结构推理。长期以来，解决数独问题的研究主要沿着两条主流路径展开：

然而，这两种现有方法均存在显著的局限性，且这些局限往往是互补的：

基于学习的方法：虽然灵活，但缺乏对“硬正确性”（hard correctness）的严格保证。这意味着模型可能会产生看似合理但实际上违反约束的错误解，且难以提供可解释的错误边界。
完整的符号求解器：虽然能保证解的正确性，但在面对复杂实例时，仍容易陷入长尾搜索（long-tail search）困境，即搜索空间巨大，导致计算成本极高，效率低下。

为了克服上述缺陷，研究人员提出了一种新颖的扩散模型引导方法，命名为 DiBS（Diffusion-Informed Branch Selection）。该方法旨在结合符号求解器的完备性与机器学习的全局指导能力，从而优化分支选择过程。

DiBS 的核心思想是将扩散模型（Diffusion Model）作为分支排序（branch-ordering）的引导器，嵌入到符号求解器的搜索过程中。以下是其具体工作机制和技术细节：

DiBS 并没有完全取代传统的符号求解器，而是保留了其完备性（completeness）。符号求解器负责确保最终解满足所有约束条件，而扩散模型则作为一个轻量级的辅助模块，用于指导搜索树的遍历顺序。

在搜索过程中，当面临部分赋值（partial assignment）时，系统会生成一组候选值。DiBS 的核心方法是对这些候选值进行排序（ranking）。排序的依据包括：

研究团队不仅提出了算法，还提供了深入的理论证明，揭示了 DiBS 为何有效以及其工作原理。理论分析表明，通过引入扩散模型的全局视角，可以有效剪枝那些在局部看似合理但在全局约束下会导致死胡同的分支。

研究在具有挑战性的 Royle 17-clue Sudoku 基准测试上进行了实验。这是数独求解领域的硬指标，因为17个提示数是已知能产生唯一解的最小线索数，此类实例通常极其困难，搜索成本高昂。

实验结果对比了 DiBS 与强大的启发式基线方法，主要指标包括：

搜索节点数（Nodes）：DiBS 显著减少了需要探索的节点数量。
回溯次数（Backtracks）：大幅降低了无效搜索后的回溯频率。
长尾百分位（Long-tail percentiles）：在最困难的实例中，DiBS 的表现提升尤为明显，证明了学到的全局引导在分支排序错误代价最高的情况下非常有效。

DiBS 的提出对于约束满足问题（CSP）和人工智能搜索领域具有重要的理论和实践意义：

范式创新：它展示了扩散模型（通常用于生成任务）在离散优化和逻辑推理任务中的潜在价值，拓展了扩散模型的应用边界。
解决长尾难题：在数独等 CSP 问题中，最难解决的实例往往集中在长尾分布中。DiBS 证明，通过引入学习到的全局结构信息，可以有效缓解长尾搜索带来的计算爆炸问题。
可信 AI 的探索：在需要高可靠性保证的场景（如形式化验证、自动定理证明）中，纯深度学习模型因缺乏正确性保证而难以落地。DiBS 提供了一种“学习型引导 + 符号性验证”的混合范式，为构建既高效又可信的 AI 系统提供了新思路。
通用性潜力：虽然本文以数独为例，但其核心思想——利用生成模型学习约束结构以指导离散搜索——可以推广到其他复杂的 CSP 问题，如数独变体、逻辑谜题、甚至更广泛的组合优化问题。

总之，DiBS 不仅是一个针对数独的高效求解器，更是连接生成式 AI 与符号推理的重要桥梁，为未来解决复杂约束问题提供了新的技术路径。