← 返回信息流
技术博客arXiv cs.AI·1 小时前

个性化幻灯片生成的新方法:逆规划与结构去噪代理

原标题:Personalization as Inverse Planning: Learning Latent Design Intents for Agentic Slide Generation via Structural Denoising

速览

幻灯片个性化设计涉及主题和布局两个方面,当前AI代理方法难以捕捉细粒度页级意图。SPIRE将页面级幻灯片个性化问题(PSP)建模为逆规划任务,构建无须依赖具体工具(如PowerPoint、Beamer)的设计意图学习机制。框架通过有意破坏幻灯片结构创建可验证去噪任务,两位代理协同利用强化学习优化可执行设计。研究证明结构去噪是PSP的一致代理,且多代理减少了RL策略梯度方差。实验验证SPIRE在复杂个性化生成上的显著优势,为AI驱动的智能幻灯片工具开辟了新路径。

AI 深度解读

背景

当前基于 AI 的代理方法在幻灯片设计领域面临显著挑战。设计者需要对整份演示文稿的主题和每一页的布局进行细致个性化调整。然而,这些方法在精细化、页面级别的设计上表现不佳。单纯依赖预设模板或用户冗长的指令,无法捕捉潜藏的设计意图,导致页面级幻灯片个性化(Page-level Slide Personalization, PSP)这一问题仍未解决。

核心内容

本研究将 PSP 问题正式化为反向规划(inverse planning)问题。作者提出一种设计意图学习方法,该方法无需假设具体执行工具(如 PowerPoint、Beamer)的知识。然而,放弃对这些工具的控制会使端到端优化变得棘手且难以处理。为此,作者提出 SPIRE 框架作为 PSP 的近似求解器。

SPIRE 框架的核心机制是故意破坏干净幻灯片的视觉结构,创建可验证的去噪任务。两个代理通过协作方式学习如何精细调整可执行的设计,并利用强化学习(RL)完成这一过程。文章提供了结构去噪作为 PSP 一致替代的证明,以及多代理公式在 RL 中严格降低策略梯度方差的严格证明。

关键要点

  • 将页面级幻灯片个性化(PSP)建模为反向规划问题,核心是学习潜藏的设计意图,而不依赖具体工具知识。
  • 框架 SPIRE 通过结构去噪解决优化困境:故意破坏干净幻灯片结构,构建可验证的去噪任务。
  • 两个代理通过协作在去噪过程中精细调整可执行设计,并借助强化学习(RL)实现优化。
  • 提出结构去噪是 PSP 一致替代的证明,以及多代理公式严格降低 RL 策略梯度方差。
  • 大规模实验验证 SPIRE 在幻灯片设计任务上的优越性。

意义与影响

该研究首次将 PSP 问题系统化地转化为可优化的反向规划形式,并提出了可行的 SPIRE 框架,有效解决了当前 AI 代理方法在细粒度页面级设计的局限性。SPIRE 的结构去噪机制与多代理 RL 结合,不仅提升了设计质量,还为后续基于 Agent 的幻灯片生成系统提供了可靠的技术路径。研究成果有望推动个人化演示文稿工具的普及,提升设计效率与用户满意度,为 AI 代理在创意任务中的应用开辟新方向。

查看原文 →arxiv.org