技术博客arXiv cs.AI·3 小时前

面向可信AI：连续数据摘要的多目标对抗攻击与鲁棒防御

原标题：Toward Trustworthy AI: Multi-Target Adversarial Attacks and Robust Defenses for Continuous Data Summarization

速览

该研究针对连续数据摘要过程提出多目标对抗攻击方法，通过DR-次模优化揭示上游数据处理的脆弱性。同时构建了正则化最大-最小鲁棒防御机制，以缓解混合攻击类型的影响。实验表明，所提攻击在低预算下有效降低下游任务性能，而防御策略则显著提升了结构化设置下的鲁棒性。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）