快手部署DIF算法,解决冷启动推荐中的隐式反馈噪声问题
速览
针对推荐系统中冷启动物品易受隐式反馈噪声(如点击诱饵、位置偏差)影响的问题,研究提出模型无关的去噪方法DIF。该方法利用用户对内容偏好的稳定性,通过相似热物品推断冷物品的伪标签,并结合内容相似度评估置信度以聚合标签。此外,DIF通过相对熵和冷启动状态显式估计噪声标签的不确定性,自适应校正样本级噪声。该方法已在快手十亿级用户短视频应用中部署,显著提升了冷启动场景下的商业指标。
AI 深度解读
去噪隐式反馈:解决冷启动推荐难题
背景
在推荐系统领域,隐式反馈(Implicit Feedback)因其易获取性和普遍性而被广泛采用。用户的行为数据,如点击、浏览时长、点赞等,构成了推荐算法的主要训练信号。然而,隐式反馈数据往往伴随着严重的噪声问题。例如,“标题党”内容可能吸引点击但并非用户真实兴趣,位置偏差(Position Bias)可能导致用户仅仅因为物品排在前面而点击,这些噪声样本会严重干扰模型的训练效果。
与此同时,推荐系统不可避免地面临“物品冷启动”(Item Cold-start)问题。随着新物品不断涌入系统,缺乏历史交互数据的冷物品难以被准确推荐。现有的去噪研究通常基于启发式模式(如较高的损失值)来识别噪声样本,并通过样本选择或重加权来减轻噪声影响。然而,这些方法适应性有限,且在冷启动场景下往往失效。
本文指出,由于上述因素,冷物品更容易受到噪声样本的影响,而研究人员往往忽视了针对冷物品进行隐式反馈去噪的重要性。
核心内容
为了解决冷启动推荐中的隐式反馈去噪问题,作者提出了一种模型无关的去噪方法,称为 DIF (Denoising Implicit Feedback)。该方法的核心逻辑建立在用户偏好稳定性的假设之上,并通过内容相似度推断伪标签,进而修正噪声。
具体而言,DIF 方法包含以下三个关键步骤:
-
基于内容相似度的伪标签推断 由于用户对内容的偏好相对稳定,即使面对没有历史交互数据的冷物品,也可以通过寻找与其内容相似的“热物品”(Warm Items,即拥有丰富交互数据的物品)来推断用户对该冷物品的兴趣。如果用户对内容相似的热物品表现出强烈兴趣,则可以推断用户也可能对冷物品感兴趣。
-
基于相似度的置信度建模与聚合 为了提高伪标签的准确性,DIF 不仅生成伪标签,还根据冷物品与热物品之间的内容相似度来建模伪标签的置信度。随后,算法会对每个样本的多个伪标签进行聚合,从而生成更可靠的监督信号。
-
基于相对熵的不确定性估计与自适应校正 最后,DIF 显式地估计噪声样本标签的不确定性。这一估计结合了样本的相对熵(Relative Entropy)以及物品的冷启动状态。通过这种不确定性估计,算法能够自适应地引导伪标签在样本级别上修正噪声标签,即在模型对某个样本的预测不确定性较高且该物品处于冷启动状态时,更多地依赖伪标签进行校正。
关键要点
- 问题识别:冷物品因缺乏历史数据,更容易受到隐式反馈中噪声(如点击诱饵、位置偏差)的影响,而现有去噪方法在冷启动场景下效果不佳。
- 方法创新:提出了模型无关的去噪框架 DIF,不依赖于特定推荐模型的架构。
- 伪标签生成机制:利用用户偏好的稳定性,通过内容相似的热物品推断用户对冷物品的兴趣,生成伪标签。
- 置信度加权:根据冷物品与热物品的内容相似度来量化伪标签的置信度,并对多个伪标签进行聚合以提升准确性。
- 自适应校正:结合相对熵和冷启动状态来估计标签不确定性,从而在样本级别自适应地调整伪标签对噪声标签的修正力度。
- 理论支持:该方法不仅经过广泛的实验验证,还提供了理论依据支持其优越性。
意义与影响
DIF 方法的有效性得到了理论证明以及在真实世界数据集上的广泛实验支持。其最重要的实际应用成果在于,该方法已被部署在拥有十亿级用户规模的短视频应用 Kuaishou(快手)上。
在快手的生产环境中,DIF 显著改善了冷启动场景下的各项商业指标。这表明,针对冷启动场景专门设计的隐式反馈去噪方法,能够有效提升推荐系统的准确性和用户体验,具有极高的工业应用价值。这一成功案例也证明了从内容相似度角度解决冷启动噪声问题的可行性和有效性。
