技术博客arXiv cs.CL·8 天前

LATTE：用于个性化LLM生成的同行锚定偏好轨迹预测

原标题：LATTE: Forecasting Peer Anchored Preference Trajectories for Personalized LLM Generation

速览

该研究提出LATTE框架，将个性化生成建模为预测同行锚定的相对偏好状态。通过减去时间掩码基线消除物品内容干扰，并利用轻量级序列预测器预测用户偏好轨迹。实验表明，该方法在Amazon Reviews等数据集上显著优于现有检索、摘要及静态潜在配置文件基线。

AI 深度解读

LATTE：基于同行锚定偏好轨迹预测的个性化 LLM 生成框架

背景

在利用冻结权重的大语言模型（Frozen Large Language Models, LLMs）进行个性化生成的任务中，核心挑战在于如何为模型提供一个既紧凑（compact）又具有时效性（current）的条件信号（conditioning signal）。现有的个性化方法主要依赖两种路径：一是检索或总结用户的历史文本记录；二是将这些历史数据压缩为静态的潜在配置文件（static latent profiles）或软提示（soft prompts）。

尽管上述方法在计算效率上表现良好，但它们存在一个根本性的缺陷：将用户过去的行为视为一个聚合后的静态画像。这种处理方式混淆了三种截然不同的信息维度：

稳定的身份特征（Stable Identity）：用户长期不变的兴趣或性格。
近期的漂移（Recent Drift）：用户兴趣随时间发生的细微变化。
项目内容本身（Item Content）：用户交互过的具体物品或内容的固有属性。

由于缺乏对时间动态性的建模，现有方法难以区分“用户喜欢这个物品是因为它本身好”还是“用户最近恰好喜欢这类物品”，从而导致个性化生成的精度受限。

核心内容

为了解决上述问题，研究团队提出了 LATTE（LAtent Trajectory Tracking and Extrapolation，潜在轨迹追踪与外推）框架。该框架的核心思想是将个性化生成重新定义为一种基于同行锚定（Peer-Anchored）的相对偏好状态预测问题。

1. 同行锚定基线（Peer-Anchored Baseline）

LATTE 不再直接处理原始的用户历史数据，而是通过“差分”的方式提取用户特有的偏好信号。对于每一个历史会话，LATTE 会构建一个时间掩码基线（Time Masked Baseline）。这个基线由那些对同一物品做出过响应的可比用户（Comparable Users）组成。

通过从目标用户的响应中减去这个基线，LATTE 生成了一个状态向量。这个状态向量衡量的是：在共享的物品上下文（Shared Item Context）下，目标用户与同行群体相比，其偏好差异有多大。这种方法有效地抵消了物品本身的固有属性带来的噪声，突出了用户相对于群体的独特性。

2. 轨迹预测（Trajectory Forecasting）

在提取出每个历史会话的相对偏好状态后，LATTE 使用一个轻量级的序列预测器（Lightweight Sequence Predictor）来预测该轨迹中的下一个状态。这意味着模型不仅关注用户过去的静态画像，而是预测用户偏好的动态演变趋势。

3. 状态到令牌桥接（State to Token Bridge）

预测出的未来偏好状态需要通过某种方式注入到冻结的指令微调 LLM 中。LATTE 设计了一个“状态到令牌桥接器”，将预测出的高维状态映射为一个单一的锚定软令牌（Anchored Soft Token）。这个软令牌作为条件信号，直接输入到冻结的 LLM 中，指导其生成符合用户当前偏好轨迹的内容。

4. 理论分析与实验验证

研究团队提供了潜在因子分析（Latent Factor Analysis），从理论上解释了为什么同行锚定能够抵消共享的物品变异，以及为什么时间预测能够在“过时的平均值”和“嘈杂的近期状态”之间取得更好的权衡。

在 Amazon Reviews 2023 和 MemoryCD 数据集上的实验表明，LATTE consistently（一致地）优于以下基线方法：

检索（Retrieval）
总结记忆（Summary Memory）
静态潜在配置文件（Static Latent Profiles）
差异感知潜在配置文件（Difference Aware Latent Profiles）
软提示压缩（Soft Prompt Compression）

具体数据上，在 Amazon Reviews 2023 数据集上，静态潜在配置文件的平均 ROUGE-L 分数为 0.219，最强的添加潜在压缩基线为 0.245，而 LATTE 将其提升至 0.259。额外的成对比较和诊断分析进一步证实，性能的提升主要归功于对用户特定轨迹信息的预测，而不仅仅是增加了一个软提示接口。

关键要点

动态优于静态：LATTE 摒弃了将用户历史视为静态聚合画像的做法，转而采用动态轨迹预测，能够区分用户的稳定身份、近期兴趣漂移以及物品本身的属性。
同行锚定去噪：通过引入“时间掩码基线”，LATTE 利用相似用户对同一物品的反应来构建基线，从而在差分过程中消除物品内容带来的共同变异，提取出纯粹的用户相对偏好。
轻量级预测与注入：框架包含两个关键组件：轻量级的序列预测器用于预测偏好状态的下一步，以及状态到令牌桥接器将预测状态转化为单个软令牌，高效地注入冻结 LLM，保持了推理的高效性。
实证性能提升：在 Amazon Reviews 2023 等基准测试中，LATTE 显著超越了检索、摘要、静态配置文件及软提示压缩等多种主流基线方法，ROUGE-L 指标有明显提升。
因果归因明确：通过诊断分析确认，性能增益主要来源于对“用户特定轨迹信息”的预测能力，而非仅仅依赖于软提示技术的改进。

意义与影响

LATTE 框架为个性化大语言模型生成提供了一条新的技术路径，其意义主要体现在以下几个方面：

解决“静态画像”的局限性：现有的个性化 LLM 方法大多受限于静态表示，难以捕捉用户兴趣的快速变化。LATTE 引入的时间序列预测机制，使得模型能够适应用户偏好的短期波动和长期漂移，提高了生成的时效性和相关性。
解耦物品与用户偏好：通过同行锚定（Peer Anchoring）机制，LATTE 有效地将“物品本身的吸引力”与“用户的独特偏好”分离开来。这对于推荐系统和个性化内容生成至关重要，因为它防止了模型仅仅因为物品热门而推荐它，而是真正基于用户的相对偏好进行生成。
高效性与可扩展性：LATTE 不需要微调庞大的 LLM，而是通过轻量级的预测器和单一的软令牌进行条件注入。这种设计既保留了冻结 LLM 的知识能力，又实现了低成本的个性化适配，适合在资源受限的环境或大规模用户场景下部署。
理论贡献：研究提供的潜在因子分析为理解个性化生成中的噪声来源和动态建模的有效性提供了理论支撑，有助于后续研究更好地设计去噪和预测机制。

总之，LATTE 展示了如何通过精细的状态建模和时间预测，在冻结 LLM 上实现更精准、更动态的个性化生成，为下一代智能助手和内容生成系统提供了重要的参考范式。

查看原文 →arxiv.org