← 返回信息流
AI 资讯雷峰网·2 小时前

腾讯犀牛鸟计划三篇论文入选ICML 2026

原标题:犀牛鸟前沿 | 犀牛鸟精英人才 ICML 2026 入选论文解读

速览

腾讯犀牛鸟精英人才计划三篇入选ICML 2026的论文解读发布。研究分别聚焦于大语言模型的高效混合策略蒸馏、多示例思维链上下文学习优化,以及基于3D几何先验的稀疏视角视频生成技术。这些成果展示了校企联合培养在推动AI前沿技术突破方面的显著成效。

AI 深度解读

犀牛鸟前沿 | ICML 2026 入选论文深度解读

腾讯犀牛鸟精英人才计划自 2017 年启动以来,致力于拔尖科研人才的产学联合培养。该计划通过开放新技术研发中的关键难题,选拔具备潜力的优秀学生,在校企双导师(如上海交通大学、香港科技大学、北京大学教授与腾讯混元、微信、营销团队专家)的联合指导下,依托真实产业场景开展前沿探索。

本文聚焦于该计划入选 ICML 2026(International Conference on Machine Learning)的三篇高水平论文,分别涵盖高效模型蒸馏、长上下文推理优化以及稀疏视角视频生成三个核心 AI 技术方向。

背景

随着大语言模型(LLM)和生成式 AI 的快速发展,模型规模日益庞大,对计算资源的需求呈指数级增长,同时复杂推理任务和视频生成中的几何一致性等问题依然面临挑战。腾讯犀牛鸟精英人才计划旨在通过产学研结合,解决这些实际落地中的技术瓶颈。

本次入选 ICML 2026 的三篇论文分别由以下团队完成:

  1. 高效模型蒸馏:由腾讯犀牛鸟精英人才朱文红同学(上海交通大学王瑞副教授、刘鹏飞副教授及腾讯混元团队指导)完成。
  2. 长上下文推理:由腾讯犀牛鸟精英人才鍾芷婷同学(香港科技大学楊瓞仁教授及腾讯微信团队指导)完成。
  3. 稀疏视角视频生成:由腾讯犀牛鸟精英人才刘烜奕同学(北京大学马思伟教授及腾讯营销团队指导)完成。

核心内容

1. 混合策略蒸馏(HPD):统一知识蒸馏视角

针对知识蒸馏(Knowledge Distillation, KD)在压缩大语言模型时有效性依赖于发散方向、优化策略和数据制度等紧密耦合设计选择的问题,该研究提出了一种统一的观点。

  • 理论重构:研究将 KD 重新表述为一个令牌级别(token-level)的重加权对数似然目标,系统分解了现有方法并揭示了其潜在联系。
  • HPD 方法:基于上述观点,提出了混合策略蒸馏(Hybrid Policy Distillation, HPD)。该方法结合了正向 KL 散度和反向 KL 散度的互补优势,旨在平衡模式覆盖(mode coverage)和模式搜索(mode exploration)。同时,HPD 将非策略数据与轻量级的近似策略抽样集成在一起。
  • 评估结果:在长形式数学推理、短形式对话和代码生成任务上进行了广泛评估。结果表明,HPD 在不同的模型族和规模上,始终提高了优化稳定性、计算效率和最终性能。

2. 长上下文推理中的 CoT-ICL 扩展规律与 CDS 方法

针对上下文学习(In-context Learning, ICL)在多示例思维链(CoT)场景下的表现,研究指出标准扩展规律在推理任务中并不适用。

  • 现象发现:通过广泛实验发现,(i) 扩展效应具有任务依赖性,增加 CoT 示例主要利好推理型 LLM;(ii) 基于语义相似度的检索在推理任务中失效,因为语义相似度难以预测 CoT 的兼容性;(iii) 随着 CoT 示例增多,性能方差显著增大。
  • 理论解释:研究将多示例 CoT-ICL 的本质重新定义为“上下文测试时学习”(context test-time learning),而非简单的模式匹配。
  • CDS 方法:基于“示例应易被模型理解”且“按概念递进排列”两项原则,提出了示例排序优化方法 CDS。
  • 效果验证:在数学与叙事推理任务上,CDS 方法实现了平均 3.81% 的性能提升。该研究将长上下文窗口从被动的“检索缓存”重新定义为“上下文测试时学习的结构化课程”。

3. CamGeo:基于稀疏约束的 3D 几何知识蒸馏

针对基于稀疏相机约束的图像到视频生成中,因缺乏鲁棒 3D 先验知识而导致的姿态漂移和运动不连续性问题,该研究提出了 CamGeo 框架。

  • 核心机制:CamGeo 创新性地将从预训练的视频到 3D 模型(VGGT)中获取的丰富 3D 几何知识,直接蒸馏到扩散骨干网络中。
  • 无延迟策略:为实现这一目标且不增加推理延迟,研究提出了一种仅在训练阶段进行的蒸馏策略。
  • 三大模块
    1. 关键帧轨迹蒸馏:通过稀疏输入姿态确保周期一致性。
    2. 跨帧一致性蒸馏:结合摄像机轨迹与深度约束,在无监督帧之间生成一致的结构。
    3. 三阶段课程学习:采用从粗到细的策略,逐步提升几何复杂度,从全局结构连贯性优化过渡到细粒度优化,从而实现稳定的优化过程。
  • 实验结论:在各种稀疏度设置下,CamGeo 均实现了稳定的性能提升,有效解决了稀疏视角下的几何一致性问题。

关键要点

  • 蒸馏方法的统一与优化:HPD 通过统一令牌级别重加权对数似然目标,解决了传统 KD 方法中设计选择耦合的问题,通过混合正向/反向 KL 散度平衡探索与覆盖,提升了 LLM 压缩后的稳定性和效率。
  • 重新定义长上下文学习:研究揭示了推理任务中多示例 CoT-ICL 并非简单的模式匹配,而是上下文测试时学习。通过优化示例排序(CDS),解决了语义检索在推理任务中的失效问题,显著提升了推理性能。
  • 3D 几何先验的轻量化注入:CamGeo 框架通过仅在训练阶段进行的蒸馏策略,将 VGGT 模型的 3D 几何知识注入扩散模型,利用关键帧轨迹和跨帧一致性约束,在稀疏视角下实现了高质量、几何一致的视频生成,且不影响推理速度。
  • 产学研协同创新:三篇论文均体现了腾讯犀牛鸟计划“校企双导师”机制的优势,将高校的前沿理论探索(如上海交通大学、香港科技大学、北京大学)与腾讯实际业务场景(混元、微信、营销)紧密结合,解决了大模型落地中的具体痛点。

意义与影响

这三篇入选 ICML 2026 的论文不仅在学术界展示了中国在 AI 基础模型优化、推理机制理解以及多模态生成领域的最新进展,更在工业界应用层面提供了切实可行的解决方案。

  1. 降低大模型部署成本:HPD 提出的高效蒸馏方法有助于降低 LLM 的推理成本,提升模型在边缘设备或大规模服务中的部署效率,对推动 AI 普惠化具有重要意义。
  2. 提升复杂推理能力:对长上下文推理机制的深入解析及 CDS 方法的提出,为提升 LLM 在数学、逻辑等复杂任务上的表现提供了新路径,有助于解决当前大模型在深度推理上的短板。
  3. 突破视频生成瓶颈:CamGeo 框架解决了稀疏视角视频生成中的几何一致性问题,为低成本、高效率的 3D 视频内容生成提供了新思路,对元宇宙、影视制作及游戏开发等领域具有潜在的巨大应用价值。

总体而言,这些成果验证了腾讯犀牛鸟精英人才计划在培养顶尖科研人才、推动前沿技术落地方面的有效性,也为 AI 领域后续在模型压缩、推理优化及多模态生成方向的研究提供了重要的参考范式。

查看原文 →leiphone.com