技术博客arXiv cs.AI·3 小时前

Beyond expert users: agents should help users construct preferences, not just elicit them

AI 深度解读

背景

当前，AI Agent（智能体）在协助用户完成任务时，普遍建立在一个核心假设之上：用户是“专家”，即用户已经对自己想要什么形成了明确且完整的偏好。基于这一假设，当用户的指令不够具体时，Agent 的默认策略往往是抛出“澄清性问题”（Clarifying Questions），试图从用户那里挖掘出更多偏好细节。

然而，在真实的交互场景中，这种假设往往是不成立的。用户经常处于“不知道自己不知道”的状态，缺乏足够的领域知识来完整描述自己的需求。例如，当被问及某种面料的特性或某种专业参数时，用户根本无法给出有意义的偏好回答，除非 Agent 先帮助用户理解这些概念。现有的 Agent 交互范式过度偏好的“挖掘”，而忽视了偏好的“构建”。

核心内容

本文指出，Agent 不应仅仅假设用户是专家并挖掘其既有偏好，而应帮助用户在交互过程中构建偏好。

作者从信息经济学中经典的“搜索-体验-信任品”（Search-Experience-Credence）框架汲取灵感，提出了 CoPref 模型。该模型形式化了用户如何基于 Agent 的对话行为来构建偏好：当用户缺乏领域知识时，Agent 不能简单地询问偏好，而必须通过提供示例、解释等“教学”行为，帮助用户获取形成偏好所必需的领域知识。

为了在具体场景中验证这一理念，作者构建了 CoShop 这一交互式基准，专门用于评估 Agent 在推荐系统场景下的表现。在 CoShop 中，Agent 需要与一个遵循 CoPref 模型的用户进行对话并为其提供推荐。Agent 的绩效不再仅仅取决于它能否找到符合要求的商品，而取决于它能否帮助用户获得充分指定任务所需的知识。

作者在 CoShop 上评估了五个前沿大模型（Frontier Models），结果令人深思：尽管给予了 5 轮交互的机会，没有任何一个 Agent 的推荐准确率超过 56%。进一步分析表明，Agent 的失败并非源于其搜索或匹配商品的能力不足，而是因为交互过程未能有效扩展用户对“自身需求”的认知。Agent 依然停留在传统的澄清性提问上，而没有真正帮助用户构建起对领域知识的理解，导致用户始终无法明确自己的偏好。

查看原文 →arxiv.org

Beyond expert users: agents should help users construct preferences, not just elicit them

AI 深度解读

背景

核心内容

相关推荐