← 返回信息流
AI 资讯雷峰网·3 小时前

ICML 2026前瞻:投稿翻倍,机器学习换挡发力

原标题:ICML 2026前瞻:投稿翻倍背后,机器学习正在换挡

速览

第43届ICML 2026将在首尔举行,主题聚焦机器学习在真实世界中的落地。投稿量较去年翻倍,接受率持平于26.6%,同时推出参会展示可选和原始投稿公开等新制度。研究方向从Transformer等饱和领域转向具身智能、世界模型、AI安全等前沿,LLM推理占比近20%,强化学习与模型压缩并行升温,中国研究者贡献显著,标志行业向实用化、可靠性与效率转型。

AI 深度解读

ICML 2026前瞻:投稿翻倍背后,机器学习正在换挡

背景

第43届国际机器学习大会(ICML 2026)将于2026年7月6日–11日首次在韩国首尔COEX会展中心举行,会议主题为“Machine Learning for the Real World”,强调机器学习在真实场景中的落地。会议由张潼担任总主席(General Chair),张潼现任UIUC计算机系教授,曾任腾讯AI Lab主任、百度研究院副院长,是ICML历史上首位华人主席。

根据计算机科学会议统计看板(CS Conf Stats)的最新数据显示,今年共接收论文6352篇(常规主赛道论文),102%的增幅,接受率26.6%,与去年的26.9%基本持平。总投稿量达23918篇,Spotlight占比2.2%,Oral演讲占总投稿数的0.7%。这是ICML创办43年来投稿量增长最为显著的一年。

核心内容

ICML 2026的投稿量翻倍引发关注,机器学习研究正从增量改进转向更深层次的应用。会议首次实行两项重要制度调整:参会展示改为可选,接收论文作者可选择仅以论文集形式收录,在会议记录中享有同等地位且均可参评奖项;原始投稿版本将被公开,包括匿名评审意见、作者Rebuttal及审稿人、作者讨论内容。

近三年ICML热点关键词串联显示,机器学习的转向脉络清晰:2024-2025年“Transformer变体、PEFT微调、扩散模型优化”等方向日渐饱和,纯粹增量改进难以生存。2025年底以来红利方向包括Alignment、Agent、可解释性、测试时训练(TTT),这些已成为今年论文主体。当前战略高地为具身智能的世界模型、科学计算的深水区,以及可信AI的政策框架。

论文方向变化反映行业焦虑。从OpenReview录用论文Keywords全量检索看,LLM相关论文占接收论文近20%,算上对齐、安全、Agent等间接相关方向,比例超过30%。研究性质发生根本变化:不再单纯堆参数,更多聚焦“思考”。多篇论文探讨在推理阶段投入更多计算资源能否超越单纯增大参数量。MCTS(蒙特卡洛树搜索)被引入LLM推理,提出预算感知的搜索策略;另有研究从信息论视角分析隐式思维与显式思维链的边界,追问模型在“不说话”的时候能否推理。

强化学习(RL)成为今年第一大方向,886篇论文,PPO系列独占201篇。DeepSeek-R1背后的GRPO技术被多篇论文进一步变体化,研究者拆解其有效性并探索跨场景复现。中国工作被系统性引用和分析。

AI安全论文114篇,成为ICML 2026第三大热门方向。会议6位Invited Talk演讲者中,3位核心研究涉及AI安全、对齐或社会影响:Verena Rieser(Google DeepMind)、Arvind Narayanan(普林斯顿)和Pascale Fung(港科大)。

模型压缩论文116篇,位列第二,仅次于图像生成。产业级焦虑驱动:大模型贵,开发者苦token久。KV缓存优化是子话题焦点,从关键token选择到缓存复用策略,解决LLM推理内存瓶颈。MoE架构创新活跃,如可微最优传输驱动的Dense→MoE转换、正交增长策略,在不损失质量前提下降低推理成本。扩散LLM加速方向同样升温:扩散模型论文446篇,因可控生成和多模态融合优势显著,自适应缓存、并行解码、熵感知分束等方法缩小与自回归LLM效率差距。

其他方向增速惊人。AI for Science约860篇论文,占总量13.5%,从基因组序列基础模型dnaHNet到形式化数学自动证明APE-Bench,AI从辅助工具转为科研主体参与者。具身智能方向约420篇,增长势头最猛。斯坦福团队VLAW方法让视觉-语言-动作策略与世界模型迭代协同,在真实世界操作任务中实现39.2%性能提升,从虚拟到物理世界,是产业关注信号。

中国研究者在具体方向上表现突出。张潼担任大会主席。清华、北大、中科院、浙大论文入选频率提升,北京大学、上海交通大学各有9篇高水平论文,浙江大学3篇。DeepSeek-R1让社区审视低成本高性能路线,不需几万张卡即可竞争性推理。中国机构在多模态贡献完整链路:Qwen-VL(阿里)、InternVL(OpenGVLab/复旦)、DeepSeek-VL等。企业侧,腾讯、阿里、字节、百度、华为论文入选,华为昇思和百度飞桨系统贡献获国际引用。美国基础理论积累领先,欧洲概率方法与理论深度明显,但中国研究者开始定义问题,参与方式发生结构性变化。

关键要点

  • ICML 2026投稿量达23918篇(102%增幅),接收6352篇(26.6%接受率),创43年最高投稿记录。
  • 参会展示可选、原始投稿公开等两项新制度提升学术透明度。
  • LLM相关论文占接收论文近20%(间接相关超30%),聚焦推理计算而非参数堆叠。
  • RL论文886篇(PPO 201篇)、AI安全114篇、模型压缩116篇成前三大方向。
  • AI for Science约860篇(13.5%占比)、具身智能约420篇增速最快,VLAW方法在具身任务中提升39.2%。
  • 中国研究者参与增强:张潼担任总主席,多模态和具体方向贡献突出,机构入选论文增多。
  • 研究转向后训练驱动:从预训练到让模型“学会思考”“学会安全”“变得高效”。

意义与影响

投稿量翻倍标志AI研究生产力质变,LLM辅助写作和从业者群体膨胀是核心驱动。技术方向从预训练驱动转向后训练驱动,ICML 2026给出答案:让模型学会思考、学会安全、变得高效。Position论文增多,提供观点性主张,而非实验结果,涉及Agent规范、可解释性标准等。

会议首次落地韩国,华人总主席张潼带领下,中国研究者从“跟随者”转向“被引用者”。会议主题“Machine Learning for the Real World”与论文方向紧密呼应,具身智能、科学计算、可信AI等落地场景研究加速,为产业界提供判断标准。雷峰网将派团队实地报道,为中国视角判断哪些方向值得关注奠定基础。整体而言,ICML 2026凸显机器学习正从关注度转向实际影响力的分水岭时刻。

查看原文 →leiphone.com