技术博客arXiv cs.CL·2 小时前

大语言模型适合图计算吗？进展与前景综述

原标题：Are Large Language Models Suitable for Graph Computation? Progress and Prospects

速览

本文针对大语言模型在图计算中的应用进行全面综述，填补了现有研究多聚焦于图学习的空白。文章将模型角色分为执行者和规划者两类范式，并分析了当前方法的优劣。研究表明，大语言模型适用于简单小规模任务，但在大规模精确计算中仍不可靠，最后提出了四个未来研究方向。

AI 深度解读

大型语言模型适合图计算吗？进展与前景

背景

近年来，大型语言模型（LLMs）在自然语言处理领域取得了突破性进展，其能力边界正不断向结构化数据和复杂推理任务延伸。图计算（Graph Computation）作为计算机科学的核心领域，涉及对结构化关系进行推理和算法操作，广泛应用于社交网络分析、推荐系统、生物信息学及知识图谱等领域。

尽管业界开始探索利用 LLM 解决图相关任务，但一个关键问题悬而未决：LLMs 究竟在何种情况下能可靠地支持此类计算？它们应如何被整合到图求解流水线中？

现有的综述文献大多聚焦于“图学习”（Graph Learning）、“文本属性图”（Text-attributed Graphs）或“图-语言建模”（Graph-Language Modeling），即侧重于利用图结构增强语言模型的表示能力，或反之。然而，针对 LLM 直接参与图计算过程（即执行具体的图算法或逻辑推理）的系统性回顾尚属空白。

本文旨在填补这一空白，通过一种基于“角色”的分类法（Role-based Taxonomy），全面回顾 LLM 在图计算中的应用，分析其优势与局限，并展望未来方向。

核心内容

文章提出了一种基于角色分类的框架，将 LLM 在图计算中的作用归纳为两大主要范式：

1. LLM 作为执行者（LLMs as Executors）

在这种范式下，LLM 直接充当求解器。模型接收图的描述（如邻接表、边列表或自然语言描述的图结构）以及具体的任务指令，直接输出计算结果或答案。

工作机制：用户将图数据转化为文本格式（例如，“节点 A 连接到节点 B，权重为 5...”），然后向 LLM 提问（例如，“请计算从 A 到 C 的最短路径”）。LLM 利用其预训练的知识库和推理能力，直接在文本层面模拟图算法的执行过程。
特点：端到端的直接映射，无需外部工具介入，依赖模型内部的隐式推理能力。

2. LLM 作为规划者（LLMs as Planners）

在这种范式下，LLM 不直接执行具体的图算法，而是扮演“大脑”或“协调者”的角色。它负责理解问题、分解推理步骤，并调用外部工具、代码解释器或智能体（Agents）来执行实际的计算。

工作机制：LLM 首先分析问题，制定求解计划。例如，它可能决定使用 Dijkstra 算法，然后生成相应的 Python 代码或调用特定的图数据库查询接口。外部工具执行代码后，将结果返回给 LLM，LLM 再对结果进行解释或进一步推理。
特点：解耦了“推理规划”与“具体执行”，利用外部工具保证计算的精确性和效率，LLM 专注于高层逻辑控制。

性能评估与局限性分析

基于上述分类，文章对当前方法的优势和局限性进行了深入分析：

适用场景：LLMs 在简单、小规模的图任务中表现出潜力。对于结构清晰、逻辑简单的图问题，LLM 能够给出合理的解答，尤其在需要结合自然语言理解的任务中表现优异。
主要缺陷：在大规模和高精度要求的任务中，LLMs 表现不可靠。
- 规模限制：LLM 的上下文窗口有限，难以处理包含数百万节点和边的超大规模图。
- 精确性不足：LLM 本质上是基于概率生成的，容易产生“幻觉”或计算错误。对于需要严格数学证明或精确数值结果的图算法（如精确的最短路径、最大流计算），LLM 直接执行往往出错率较高。
- 算法逻辑缺失：LLM 并未真正“理解”图算法的底层逻辑，而是通过模式匹配进行近似推理，因此在面对复杂或新颖的图结构时，泛化能力受限。

数据集与未来方向

文章总结了目前可用的相关数据集，并提出了四个未来的研究方向：

混合架构优化：如何更有效地将 LLM 的语义理解能力与传统图算法的效率相结合。
评估基准建设：建立更标准化的基准测试，以区分 LLM 的推理能力与记忆能力。
长程依赖处理：提升 LLM 处理大规模图结构中长程依赖关系的能力。
可解释性与可靠性：增强 LLM 在图计算过程中的可解释性，并提高其在关键任务中的可靠性。

关键要点

分类框架创新：文章首次通过“执行者”与“规划者”两个角色，系统性地梳理了 LLM 在图计算中的应用范式，弥补了现有综述仅关注图学习或图-语言建模的不足。
执行者范式的局限：LLM 直接作为执行者时，依赖文本化的图描述，受限于上下文窗口和生成式模型的随机性，难以保证大规模图计算的精确性。
规划者范式的优势：LLM 作为规划者，通过调用外部工具（如代码解释器、图数据库）执行计算，能够有效规避 LLM 数值计算能力弱的问题，是当前更可行的技术路径。
适用边界明确：LLM 适合处理简单、小规模、对自然语言交互要求高的图任务；但在大规模、高精度、强算法依赖的场景下，目前仍不可靠，需依赖传统算法或混合架构。
研究缺口：当前缺乏针对 LLM 图计算能力的标准化评估基准，且如何平衡 LLM 的语义推理与传统图算法的计算效率仍是未解难题。

意义与影响

这篇综述对于理解 LLM 在结构化数据领域的真实能力边界具有重要意义。它澄清了一个常见的误区：即认为 LLM 可以无缝替代传统的图算法。文章明确指出，LLM 并非通用的图计算引擎，其价值更多体现在语义理解、问题分解和交互接口层面。

对于工业界而言，这一分析指导了技术选型：在构建图智能应用时，不应盲目依赖 LLM 直接进行图遍历或优化计算，而应将其作为高层规划模块，结合传统的图数据库和算法库，形成“LLM 规划 + 传统算法执行”的混合架构。

对于学术界而言，文章提出的分类法和指出的局限性，为后续研究提供了清晰的方向。未来的研究重点将从“能否用 LLM 做图计算”转向“如何设计更高效的混合系统”，以及“如何提升 LLM 在结构化推理中的确定性和可靠性”。这标志着图人工智能（Graph AI）与大型语言模型（LLM）的融合进入了更深层次的工程化与理论化探索阶段。

查看原文 →arxiv.org