技术博客arXiv cs.AI·3 小时前

让AI负责任地拒绝用户请求

原标题：Towards Responsibly Non-Compliant Machines

速览

本文探讨了如何设计能够负责任地不执行用户请求的自主智能体。作者指出机器不合规有多种形式，并提出了任务拒绝的正当理由、覆盖不合规的路径以及安全风险与责任转移的追踪机制。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）