技术博客arXiv cs.CL·3 小时前

From Propositional to Perceptual Asymmetry: Extending Frictive Policy Optimization to Asymmetric Partial Information Dialogue

AI 深度解读

背景

在人与人的协作对话中，摩擦（如观点不对齐、产生误解、进行修复）往往是不可避免的。传统的对话系统通常将这些摩擦视为需要最小化的噪声。然而，Frictive Policy Optimization（FPO，由 Pustejovsky 等人于 2025 年提出）颠覆了这一观念，它将摩擦视为构建共同基础所必需的认知信号。

但现有的 FPO 框架及其实现存在一个核心假设：参与者共享相同的感知语境。也就是说，对话双方看到的是同一个场景，摩擦仅源于对同一场景中命题的不同解读。研究者将这种情形定义为命题不对称。然而，在现实世界的对话中，参与者往往处于非对称的部分信息环境中——双方看到的场景本身就不同，同一个指称表达会根据各自掌握的信息指向完全不同的实体。这种更复杂的情形，被称为感知不对称。本文正是将 FPO 从命题不对称扩展到了感知不对称的领域。

核心内容

本文旨在将 FPO 的理论框架从“共享感知语境下的命题不对称”拓展至“非对称部分信息下的感知不对称”。在感知不对称场景中，参与者持有不同的私有信息，相同的指称表达会因其信息状态的不同而产生不同的外延。

为了验证和评估这一扩展，研究者采用了跨语料库分析和 LLM probing 的方法

查看原文 →arxiv.org

From Propositional to Perceptual Asymmetry: Extending Frictive Policy Optimization to Asymmetric Partial Information Dialogue

AI 深度解读

背景

核心内容

相关推荐