← 返回信息流
技术博客arXiv cs.AI·3 小时前

SkillHarness:为动态环境中的计算机使用代理提供安全技能

原标题:SkillHarness: Harnessing Safe Skills for Computer-Use Agents

速览

针对计算机使用代理在动态交互环境中面临的安全风险,研究提出SkillHarness框架。该框架将技能学习建模为受安全约束的交互过程,引入技能边界识别安全技能并构建自我改进的安全约束。实验表明,该方法能显著降低不安全技能率并提升执行稳定性。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org