AI 资讯雷峰网·2 小时前

腾讯犀牛鸟计划三篇论文入选ICML 2026

原标题：犀牛鸟前沿 | 犀牛鸟精英人才 ICML 2026 入选论文解读

速览

腾讯犀牛鸟精英人才计划三篇入选ICML 2026的论文解读发布。研究分别聚焦于大语言模型的高效混合策略蒸馏、多示例思维链上下文学习优化，以及基于3D几何先验的稀疏视角视频生成技术。这些成果展示了校企联合培养在推动AI前沿技术突破方面的显著成效。

AI 深度解读

犀牛鸟前沿 | ICML 2026 入选论文深度解读

腾讯犀牛鸟精英人才计划自 2017 年启动以来，致力于拔尖科研人才的产学联合培养。该计划通过开放新技术研发中的关键难题，选拔具备潜力的优秀学生，在校企双导师（如上海交通大学、香港科技大学、北京大学教授与腾讯混元、微信、营销团队专家）的联合指导下，依托真实产业场景开展前沿探索。

本文聚焦于该计划入选 ICML 2026（International Conference on Machine Learning）的三篇高水平论文，分别涵盖高效模型蒸馏、长上下文推理优化以及稀疏视角视频生成三个核心 AI 技术方向。

背景

随着大语言模型（LLM）和生成式 AI 的快速发展，模型规模日益庞大，对计算资源的需求呈指数级增长，同时复杂推理任务和视频生成中的几何一致性等问题依然面临挑战。腾讯犀牛鸟精英人才计划旨在通过产学研结合，解决这些实际落地中的技术瓶颈。

本次入选 ICML 2026 的三篇论文分别由以下团队完成：

高效模型蒸馏：由腾讯犀牛鸟精英人才朱文红同学（上海交通大学王瑞副教授、刘鹏飞副教授及腾讯混元团队指导）完成。
长上下文推理：由腾讯犀牛鸟精英人才鍾芷婷同学（香港科技大学楊瓞仁教授及腾讯微信团队指导）完成。
稀疏视角视频生成：由腾讯犀牛鸟精英人才刘烜奕同学（北京大学马思伟教授及腾讯营销团队指导）完成。

核心内容

1. 混合策略蒸馏（HPD）：统一知识蒸馏视角

针对知识蒸馏（Knowledge Distillation, KD）在压缩大语言模型时有效性依赖于发散方向、优化策略和数据制度等紧密耦合设计选择的问题，该研究提出了一种统一的观点。

理论重构：研究将 KD 重新表述为一个令牌级别（token-level）的重加权对数似然目标，系统分解了现有方法并揭示了其潜在联系。
HPD 方法：基于上述观点，提出了混合策略蒸馏（Hybrid Policy Distillation, HPD）。该方法结合了正向 KL 散度和反向 KL 散度的互补优势，旨在平衡模式覆盖（mode coverage）和模式搜索（mode exploration）。同时，HPD 将非策略数据与轻量级的近似策略抽样集成在一起。
评估结果：在长形式数学推理、短形式对话和代码生成任务上进行了广泛评估。结果表明，HPD 在不同的模型族和规模上，始终提高了优化稳定性、计算效率和最终性能。

2. 长上下文推理中的 CoT-ICL 扩展规律与 CDS 方法

针对上下文学习（In-context Learning, ICL）在多示例思维链（CoT）场景下的表现，研究指出标准扩展规律在推理任务中并不适用。

现象发现：通过广泛实验发现，(i) 扩展效应具有任务依赖性，增加 CoT 示例主要利好推理型 LLM；(ii) 基于语义相似度的检索在推理任务中失效，因为语义相似度难以预测 CoT 的兼容性；(iii) 随着 CoT 示例增多，性能方差显著增大。
理论解释：研究将多示例 CoT-ICL 的本质重新定义为“上下文测试时学习”（context test-time learning），而非简单的模式匹配。
CDS 方法：基于“示例应易被模型理解”且“按概念递进排列”两项原则，提出了示例排序优化方法 CDS。
效果验证：在数学与叙事推理任务上，CDS 方法实现了平均 3.81% 的性能提升。该研究将长上下文窗口从被动的“检索缓存”重新定义为“上下文测试时学习的结构化课程”。

3. CamGeo：基于稀疏约束的 3D 几何知识蒸馏

针对基于稀疏相机约束的图像到视频生成中，因缺乏鲁棒 3D 先验知识而导致的姿态漂移和运动不连续性问题，该研究提出了 CamGeo 框架。

核心机制：CamGeo 创新性地将从预训练的视频到 3D 模型（VGGT）中获取的丰富 3D 几何知识，直接蒸馏到扩散骨干网络中。
无延迟策略：为实现这一目标且不增加推理延迟，研究提出了一种仅在训练阶段进行的蒸馏策略。
三大模块：
1. 关键帧轨迹蒸馏：通过稀疏输入姿态确保周期一致性。
2. 跨帧一致性蒸馏：结合摄像机轨迹与深度约束，在无监督帧之间生成一致的结构。
3. 三阶段课程学习：采用从粗到细的策略，逐步提升几何复杂度，从全局结构连贯性优化过渡到细粒度优化，从而实现稳定的优化过程。
实验结论：在各种稀疏度设置下，CamGeo 均实现了稳定的性能提升，有效解决了稀疏视角下的几何一致性问题。

关键要点

蒸馏方法的统一与优化：HPD 通过统一令牌级别重加权对数似然目标，解决了传统 KD 方法中设计选择耦合的问题，通过混合正向/反向 KL 散度平衡探索与覆盖，提升了 LLM 压缩后的稳定性和效率。
重新定义长上下文学习：研究揭示了推理任务中多示例 CoT-ICL 并非简单的模式匹配，而是上下文测试时学习。通过优化示例排序（CDS），解决了语义检索在推理任务中的失效问题，显著提升了推理性能。
3D 几何先验的轻量化注入：CamGeo 框架通过仅在训练阶段进行的蒸馏策略，将 VGGT 模型的 3D 几何知识注入扩散模型，利用关键帧轨迹和跨帧一致性约束，在稀疏视角下实现了高质量、几何一致的视频生成，且不影响推理速度。
产学研协同创新：三篇论文均体现了腾讯犀牛鸟计划“校企双导师”机制的优势，将高校的前沿理论探索（如上海交通大学、香港科技大学、北京大学）与腾讯实际业务场景（混元、微信、营销）紧密结合，解决了大模型落地中的具体痛点。

意义与影响

这三篇入选 ICML 2026 的论文不仅在学术界展示了中国在 AI 基础模型优化、推理机制理解以及多模态生成领域的最新进展，更在工业界应用层面提供了切实可行的解决方案。

降低大模型部署成本：HPD 提出的高效蒸馏方法有助于降低 LLM 的推理成本，提升模型在边缘设备或大规模服务中的部署效率，对推动 AI 普惠化具有重要意义。
提升复杂推理能力：对长上下文推理机制的深入解析及 CDS 方法的提出，为提升 LLM 在数学、逻辑等复杂任务上的表现提供了新路径，有助于解决当前大模型在深度推理上的短板。
突破视频生成瓶颈：CamGeo 框架解决了稀疏视角视频生成中的几何一致性问题，为低成本、高效率的 3D 视频内容生成提供了新思路，对元宇宙、影视制作及游戏开发等领域具有潜在的巨大应用价值。

总体而言，这些成果验证了腾讯犀牛鸟精英人才计划在培养顶尖科研人才、推动前沿技术落地方面的有效性，也为 AI 领域后续在模型压缩、推理优化及多模态生成方向的研究提供了重要的参考范式。

查看原文 →leiphone.com