ICML 2026:视觉自恢复+双奖励强化学习提升受损图像理解
原标题:ICML 2026:视觉自恢复 + 双奖励强化学习,提升受损图像理解
速览
ICML 2026论文提出Robust-U1方法,解决多模态模型在图像受损时缺乏视觉证据的问题。该方法基于BAGEL模型,利用图像恢复监督训练和带双重视觉奖励的强化学习,生成恢复图作为中间推理证据。实验显示,通过原图与恢复图联合推理,模型在R-Bench等基准上显著优于基线,有效提升了视觉鲁棒性。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →leiphone.com
