← 返回信息流
技术博客arXiv cs.AI·3 小时前

面向可信AI:连续数据摘要的多目标对抗攻击与鲁棒防御

原标题:Toward Trustworthy AI: Multi-Target Adversarial Attacks and Robust Defenses for Continuous Data Summarization

速览

该研究针对连续数据摘要过程提出多目标对抗攻击方法,通过DR-次模优化揭示上游数据处理的脆弱性。同时构建了正则化最大-最小鲁棒防御机制,以缓解混合攻击类型的影响。实验表明,所提攻击在低预算下有效降低下游任务性能,而防御策略则显著提升了结构化设置下的鲁棒性。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org