AI 资讯雷峰网·4 小时前

ICML 2026：视觉自恢复+双奖励强化学习提升受损图像理解

原标题：ICML 2026：视觉自恢复 + 双奖励强化学习，提升受损图像理解

速览

ICML 2026论文提出Robust-U1方法，解决多模态模型在图像受损时缺乏视觉证据的问题。该方法基于BAGEL模型，利用图像恢复监督训练和带双重视觉奖励的强化学习，生成恢复图作为中间推理证据。实验显示，通过原图与恢复图联合推理，模型在R-Bench等基准上显著优于基线，有效提升了视觉鲁棒性。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）