让AI负责任地拒绝用户请求
原标题:Towards Responsibly Non-Compliant Machines
速览
本文探讨了如何设计能够负责任地不执行用户请求的自主智能体。作者指出机器不合规有多种形式,并提出了任务拒绝的正当理由、覆盖不合规的路径以及安全风险与责任转移的追踪机制。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
本文探讨了如何设计能够负责任地不执行用户请求的自主智能体。作者指出机器不合规有多种形式,并提出了任务拒绝的正当理由、覆盖不合规的路径以及安全风险与责任转移的追踪机制。