← 返回信息流
技术博客arXiv cs.CL·3 小时前

From Propositional to Perceptual Asymmetry: Extending Frictive Policy Optimization to Asymmetric Partial Information Dialogue

AI 深度解读

背景

在人与人的协作对话中,摩擦(如观点不对齐、产生误解、进行修复)往往是不可避免的。传统的对话系统通常将这些摩擦视为需要最小化的噪声。然而,Frictive Policy Optimization(FPO,由 Pustejovsky 等人于 2025 年提出)颠覆了这一观念,它将摩擦视为构建共同基础所必需的认知信号。

但现有的 FPO 框架及其实现存在一个核心假设:参与者共享相同的感知语境。也就是说,对话双方看到的是同一个场景,摩擦仅源于对同一场景中命题的不同解读。研究者将这种情形定义为命题不对称。然而,在现实世界的对话中,参与者往往处于非对称的部分信息环境中——双方看到的场景本身就不同,同一个指称表达会根据各自掌握的信息指向完全不同的实体。这种更复杂的情形,被称为感知不对称。本文正是将 FPO 从命题不对称扩展到了感知不对称的领域。

核心内容

本文旨在将 FPO 的理论框架从“共享感知语境下的命题不对称”拓展至“非对称部分信息下的感知不对称”。在感知不对称场景中,参与者持有不同的私有信息,相同的指称表达会因其信息状态的不同而产生不同的外延。

为了验证和评估这一扩展,研究者采用了跨语料库分析和 LLM probing 的方法

查看原文 →arxiv.org