技术博客arXiv cs.AI·2 小时前

IntentPOI：基于意图引导推理的大模型位置预测新方法

原标题：Think Before You Act: Intention-Guided Reasoning for LLM-Based Location Prediction

速览

针对现有大模型在位置预测中易受浅层轨迹和频率偏差影响的问题，研究提出IntentPOI框架。该方法将预测过程分为思考与行动两阶段，先推断用户出行意图，再据此筛选最佳地点。实验表明，该方法在三个真实数据集上均优于十一种主流基线模型。

AI 深度解读

Think Before You Act: Intention-Guided Reasoning for LLM-Based Location Prediction

背景

基于用户历史签到记录预测其下一个兴趣点（Point-of-Interest, POI）是位置服务（Location-Based Services, LBS）中的一项基础且核心的任务。随着大语言模型（LLM）在自然语言处理和逻辑推理方面的卓越表现，近期涌现出许多将 LLM 引入 POI 预测的研究。这些方法通常展现出强大的推理能力，并取得了令人瞩目的结果。

然而，现有的基于 LLM 的方法大多将预测任务简化为一步式的“轨迹到位置”的映射问题。这种简化的建模方式存在两个主要缺陷：

浅层的轨迹相关性：模型往往只关注用户历史行为的表面序列，难以捕捉深层的行为逻辑。
历史频率偏差：模型容易过度依赖用户过去最常访问的地点，导致预测结果偏向于高频访问地，而非用户当前真实意图指向的地点。

从人类行为学的角度来看，用户很少是直接“随机”选择某个地点的。相反，用户的决策过程通常是分阶段的：首先形成一种“出行意图”（Traveling Intention），例如“我想去喝咖啡”或“我需要去银行办事”，然后基于这一意图去筛选和选择具体的 POI。现有的直接映射方法忽略了这一关键的中间认知环节。

核心内容

针对上述问题，研究团队提出了 IntentPOI，这是一种两阶段的、由意图引导的推理框架。该框架的核心思想是将“意图推断”与“位置预测”显式解耦，从而将原本直接的轨迹匹配问题转化为基于意图的推理问题。

IntentPOI 的工作流程分为两个主要阶段：

1. 思考阶段（Thinking Stage）：推断中间意图

在这一阶段，模型不直接预测具体地点，而是致力于推断用户的“中间意图”。为了实现这一目标，IntentPOI 综合了以下三类关键信息：

历史移动模式：分析用户长期的出行习惯和规律。
相似同伴行为：参考具有相似背景或行为模式的其它用户的行为数据，利用群体智慧辅助判断。
时间上下文：结合当前的时间信息（如工作日/周末、早晨/夜晚），因为意图往往具有强烈的时间依赖性。

通过整合这些信息，模型能够生成一个抽象的、高层级的意图表示。

2. 行动阶段（Acting Stage）：基于意图的定位

在获得推断出的意图后，模型进入行动阶段，具体步骤如下：

构建紧凑候选池：首先根据初步信息筛选出一个较小的、可能符合用户当前情境的 POI 候选集合，以降低计算复杂度并聚焦高相关性选项。
意图引导推理：利用 LLM 的推理能力，将上一步推断出的“意图”与候选池中的具体 POI 进行匹配。模型会评估哪些地点最能与推断出的意图对齐，从而选出最终预测的下一个 POI。

通过这种两阶段的设计，IntentPOI 成功地将预测任务从简单的“轨迹-位置”直接映射，转变为更贴近人类认知过程的“意图引导推理”。

关键要点

两阶段推理架构：IntentPOI 创新性地引入了“思考-行动”范式，先推断意图，再预测位置，有效避免了单步预测中的浅层相关性陷阱。
多维信息融合：在意图推断阶段，不仅利用用户个人历史，还引入了同伴行为（Peer Behaviors）和时间上下文，显著增强了意图推断的准确性和鲁棒性。
解耦意图与位置：通过将意图推断与位置预测解耦，模型能够更灵活地处理复杂场景，例如用户意图发生转变但历史轨迹尚未完全体现的情况。
候选池优化：在行动阶段采用紧凑候选池策略，既保证了推理的效率，又通过意图引导提高了最终选择的精准度。
实证效果显著：在三个真实世界数据集上的广泛实验表明，IntentPOI consistently（一致地）优于 11 种最先进的基线模型（State-of-the-art baselines）。

意义与影响

IntentPOI 的提出对基于大语言模型的位置服务研究具有重要的理论和实践意义：

方法论创新：它挑战了传统 POI 预测中“轨迹即一切”的假设，证明了显式建模用户意图可以显著提升预测性能。这种“先思考后行动”的范式为其他序列预测任务（如推荐系统、行为预测）提供了新的思路。
解决频率偏差问题：通过引入意图引导，模型不再单纯依赖历史高频地点，而是能够根据当前的具体情境（时间、同伴、历史模式）动态调整预测，从而更准确地捕捉用户的真实需求。
提升可解释性：相比于黑盒式的端到端预测，IntentPOI 的中间意图层使得模型的决策过程更加透明。我们可以理解模型是“因为推断出用户想去喝咖啡，所以推荐了附近的星巴克”，这有助于增强用户对推荐结果的信任度。
推动 LLM 在垂直领域的应用：该研究展示了如何将 LLM 强大的推理能力与特定领域的结构化数据（签到记录）有效结合，为 LLM 在地理位置智能（Location Intelligence）领域的深入应用提供了可行的技术路径。

查看原文 →arxiv.org