AI 资讯雷峰网·4 小时前

十年ICML：AI从“算力万能”到“为谁而算”的十次思想浪潮

原标题：十年ICML，十次思想浪潮，当AI开始问“为谁而算”｜ICML2026

速览

这份资讯讲述ICML作为机器学习领域历史最悠久顶级会议，过去十年通过十次关键重磅演讲，展现了AI学科对“真正问题”的思想倒带。从2016年Silver在纽约展示深度强化学习如何将深度网络嫁接到强化学习上，相信算力与工程就能解决一切，到2017年Gelly兑现十年赌约，2025年Anca Dragan在温哥华视频中指出机器人奖励函数偏差的根本——定义的“正确”与人类差异巨大。这些演讲不仅记录算法迭代，更揭示AI从技术高潮走向对“解决”本身质疑，最终回归人本身，包括隐私、脆弱性、目标函数设计与人类价值观对齐。意义在于为读者提供行业轨迹洞察，帮助理解当代AI面临的伦理与实用挑战。

AI 深度解读

十年ICML，十次思想浪潮，当AI开始问“为谁而算”｜ICML2026

作者｜吴思梦
编辑｜岑峰

背景

ICML（International Conference on Machine Learning）是机器学习领域历史最悠久的顶级会议，2016年6月在纽约举办的第33届会议标志着十周年。十年来，该会议每年重磅的Keynote演讲如同时间胶囊，记录着AI学科对“真正问题”的反思与演进。从深度强化学习到AI for Science，再到伦理与对齐，演讲主题从“算法如何摆平一切”转向“算法本身是否值得信任”。

AI科技评论对十个关键演讲进行分析，发现行业轨迹清晰：AI从盲目乐观转向自我质疑，最终回到“人本身”。这些演讲不仅展示技术迭代，更反映整个学科对“谁在定义规则、为谁服务、付出谁的代价”这一根本追问的深入。

核心内容

2016年6月，纽约。David Silver在ICML讲台上用66页幻灯片，从Q-Learning一路推到AlphaGo。他传递出信念：深度网络嫁接到强化学习上，通用智能的涌现只是算力和工程问题。彼时AlphaGo仅三个月前在首尔4∶1击败李世石。

十年后，2025年7月，温哥华。Anca Dragan——Google DeepMind Gemini后训练联合负责人，在现场播放一段机器人机械臂视频：手臂举起杯子太高，手伸进压低它，松开后又举上去。“不是机器人笨，”她说，“是奖励函数在逼它做它认为‘正确’的事。只是我们定义的‘正确’和人类想的‘正确’，根本不在一个频道上。”

从Silver到Dragan，ICML每年的演讲记录学科对“真正问题”的倒带。AI从相信算法能解决一切，走向对“解决”本身的自我质疑；从目标函数视为既定真理，到撞向最核心现实——谁在写规则、为了谁的利益、又付出了谁的代价。最终回到问题的起点：人本身。

以下是十个声音，逐一展开。

2016·纽约——David Silver：深度强化学习的黎明

David Silver的演讲本质是路线图：从Q-Learning到Policy Gradient，从Actor-Critic到Experience Replay，再到AlphaGo的蒙特卡洛树搜索与深度价值网络融合。核心逻辑清晰：深度网络负责“看”，强化学习负责“决策”，合在一起就是一个通用问题求解器。

他观点是：如果奖励函数定义得足够好，强化学习就能在任何任务上超越人类。他展示AlphaGo技术架构，相信智能本质是最大化累积奖励。棋盘上“赢”是无需质疑的目标，物理世界中自动驾驶、机器人控制、蛋白质折叠等均可归约为同一形式。

当年AlphaGo胜利让公众和资本产生错觉：既然AI能在围棋中击败人类，解决一切只是算力和工程问题。

2017·悉尼——Sylvain Gelly & David Silver：一个精准兑现的十年赌约

2017年ICML Test of Time Award颁给Gelly、Silver等人2007年论文：将在线知识（MCTS树搜索）和离线知识（经验价值函数）融合进围棋AI——AlphaGo底层逻辑。

Gelly展示表格：2007-2017年计算机围棋Elo从1800涨到4500。他讲私人故事：十年前与同事打赌，十年内计算机围棋将打败人类职业棋手。2016年AlphaGo击败李世石提前一年兑现。

他还讲验证悖论：更强策略网络使Rollout表现更差，因为好策略剪窄搜索，局部做得越好，全局越易错过。这隐喻将在后续年份反复应验。

最意味深长的是：ICML开幕前两个月，“Attention is All You Need”论文挂arXiv。Transformer提出观点路径，影响深远。那年NIPS、ICML、ICLR加起来超过3000篇论文，此文仅之一。几乎无人知其意义。中国国务院同年7月印发《新一代人工智能发展规划》，AlphaGo余烬未消，宏观图景已近。

2018·斯德哥尔摩——Dawn Song：深度学习是一座沙堡

2018年ICML在寒流中召开，四个月前剑桥分析丑闻曝光。Dawn Song未谈丑闻，谈深度学习系统结构上脆弱。

她展示熊猫图片加噪声后被模型识别为“长臂猿”；用查询API偷商业化图像分类模型，无需侵入服务器，只需发送请求观察输出；训练阶段植入后门：给路牌贴特制贴纸，自动驾驶汽车将停车标志误读为限速标志。

Song认为，能力进步与脆弱性认知之间存在扩大剪刀差。越急于部署模型（如自动驾驶、人脸识别、医疗诊断），危险越大。从2025年回看，Song演讲预言：对抗攻击将演变成Prompt Injection，模型窃取将变成DeepSeek蒸馏OpenAI。预见更深层：一切建立在脆弱地基上。

2019·长滩——Alison Gopnik：那个说“大模型不是智能”的心理学家

2019年AI界围绕OpenAI GPT-2“太危险不能全部公开”展开。同月亚马逊面部识别对深色皮肤女性错误率高31%，Deepfake泛滥。ICML讲台站着一“局外人”——伯克利发展心理学家Alison Gopnik。

Gopnik演讲标题《What Four-year-olds Can Do and AI Can’t (Yet)》。她说，大语言模型不是“智能体”（agent），是“文化技术”（cultural technology）。如写作、印刷术、图书馆，让个体获取人类积累知识的工具。“你问‘GPT比我知道得更多吗’——这个问题本身就是错的。图书馆比我知道得更多吗？图书馆不是一个人。”

对比更锋利：儿童做“真相发现”（truth-seeking）。两岁小孩设计因果实验：挖沙子观察塌陷、把水倒在不同杯子、反复扔勺子确认重力不是随机事件。“ChatGPT不是产生幻觉，它只是不在乎真假。它的目标函数里没有这个维度。”

2023年ChatGPT捏造法庭判例导致律师被处罚，当它给澳大利亚市长编造贿赂罪，Gopnik2019年观点突然掷地有声。

2020·线上——Brenna Argall：当算法进入人的身体，谁在适应谁

2020年ICML本应在维也纳召开，改为Zoom会议，10800人次观看，75个国家。Brenna Argall Keynote主题《Human and Machine Learning for Assistive Autonomy》。

Argall是西北大学Assistive & Restorative Technology Lab负责人。实验室名字声明：技术来辅助和恢复人的能力，不是替代。但她问：当机器和人共享控制权时，谁在适应谁？

传统逻辑是“机器决策，人接受”——自动化越高，人做的事越少。Argall翻转：真正辅助自主，不是让机器做更多决定，而是让人保持对自己身体和行动掌控。她展示共享控制策略：在某些场景机器提供物理支持但人保持决策权；在另一些机器主动预判意图但保留被推翻通道。她量化不同自动化水平下用户的“感知控制感”，把权力分配变为可优化变量。

核心论点涉及分配正义：“每一个自动化决策，都意味着收回人的一部分能动性。辅助自主的核心不是技术问题——是权力如何在人和机器之间分配的问题。”

2020年全世界依赖远程技术和自动化系统，Argall追问有着穿透力：你正在设计的自动化系统，是在增强人的能力，还是悄悄剥夺人的选择？

2021·线上——Daphne Koller：AI制药的数据贫困

2021年mRNA疫苗拯救生命，AlphaFold 2解决蛋白质结构预测问题。AI for Science目光转向。Daphne Koller斯坦福教授、Coursera联合创始人、insitro CEO，把镜头从分子结构转向制药业基础设施。主题《Transforming Drug Discovery using Digital Biology》。

传统药物开发：平均10年、26亿美元、90%失败率。她目标从靶点发现到临床试验预测做全链路数字化。但演讲花大量时间讲：不是算法难，是数据难。

“ImageNet已经做到百万级精确标注，”她说，“制药业最关键的细胞表型数据还停留在手工显微镜观察。”几十年的湿实验数据，格式互不兼容，元数据缺失，“有些还在纸质实验记录本上。”

她展示insitro解决方案：用自动化湿实验室生成大规模、标准化、带有完整元数据的细胞数据，在上面训练机器学习模型。她认为，机器学习工具箱足够好，但制药业数据基础设施停留在前数字化时代。意味着在AI for Science最激动人战场，最急迫瓶颈不是模型架构，而是数据标准化和生产化。

当行业追逐更大模型和更多算力时，她提醒：在真正复杂领域，那些事关生命的领域，数据贫困仍是比算法瓶颈更根本约束。

2022·巴尔的摩——Regina Barzilay：我们是否在解决正确的问题

2022年ICML在巴尔的摩恢复线下。Regina Barzilay MIT CSAIL教授，2017年从乳腺癌中幸存后把研究转向AI+医疗。演讲主题《Solving the Right Problems: Making ML Models Relevant to Healthcare and the Life Sciences》。

她回顾1997年NLP会议：全场两三百人，大部分基于规则系统。二十年后神经方法横扫一切。但问不在议程上的问题：这二十年多少论文解决的是最终被证明不相关的问题？

例子来自医疗：大量机器学习论文优化医院再入院率预测，这是Medicare公开追踪、数据干净漂亮的指标。但在临床现实中，再入院率和医疗质量相关性远比想象低。一堆论文在优化一个和真实世界“相关”但远不等于真实世界代理变量。“我们非常擅长在别人定义的问题上跑分。定义正确的问题，才是最难的部分。”

演讲日期2022年7月。四个月后ChatGPT发布。Barzilay问“我们是否在解决正确的问题”，指医疗AI评价指标错位。但未来这个问题将变成对整个领域的提问。

2023·檀香山——Marzyeh Ghassemi：健康标签里的结构性暴力

2023年ICML在檀香山。ChatGPT发布六个月后GPT-4上线。

Marzyeh Ghassemi多伦多大学和MIT教授，Healthy ML Lab负责人。演讲主题《Taking the Pulse Of Ethical ML in Health》。她放一张胸部X光片。

实验室用700万张胸部X光片训练模型，判断病人是否“健康到可以回家”。准确率很高，State-of-the-art。然后问：能部署吗？答案是不能。因为训练数据中，“健康”标签分布不均等。有色人种患者更少被标记为“无异常”——不是他们客观上更不健康，而是来急诊室时通常已经病得更重。

这是几十年的结构性不平等在数据中的投影。如果模型部署，它会系统性把更多数族裔患者留在急诊室——医生甚至不会意识到，因为模型在验证集上表现“好”。

值得注意的是，同次会议上，OpenAI的John Schulman讲“RLHF中的代理目标”。一个讲大模型对齐，一个讲医疗模型不对齐。后者更不性感，但关乎现实生命伦理。Ghassemi揭示：在某些场景，你连用来训练“正确”标签的数据都是错的。不是模型问题，是数据里的历史已替你做了道德选择。

2024·维也纳——Soumith Chintala：开源不是慈善，是战略

2024年ICML回到维也纳，距原定2020年召开已过去四年。Soumith Chintala PyTorch缔造者、Meta VP。演讲拆流行叙事：开源不是在做好事。“让你的互补品大众化”（Commoditize your complement）引用商业格言。如果开源对竞争对手伤害远大于对你伤害，那就开源它。这不是道德，是利益计算。

他用六个角色画开源争议利益格局：学者缺算力不满闭源访问限制；大公司怕担责又想蹭开源创新；AGI创业公司急着在钱烧完前做突破；垂直AI创业者不在乎开源反正领域窄；Reddit黑客想以崇高之名行破坏之实；普通人只想安静用产品。每一方都在跑自己的多目标优化函数。

关键判断关于AGI时间线：“如果你觉得AGI两年内就会来，你对开放的态度自然会不一样。”关于“智能何时到来”的假设，本身就是一个被忽视的意识形态变量，直接决定“该做什么”的立场。Soumith结论是“我毫无歉意地站在开放一边”，理由不是道德，而是相信AGI还很远，开放能加速一切。在充斥崇高话语和末日修辞的AI讨论，有人承认选择源于可被质疑假设——这本身构成诚实。

2025·温哥华——Anca Dragan：奖励函数究竟是谁写的

Anca Dragan演讲标题《What to optimize for – from robot arms to frontier AI》。她没有答案，给出一套分类法，将过去十年所有被忽视追问收束为框架。

她把AI目标失败归为三类。

第一类：人类反馈中的系统性偏差——标注者会无意识偏好某种表达方式、某种政治立场，模型学会的不是“好”而是“标注者认为好”。Gopnik2019年说“它不在乎真假”，但如果标注者也不知道什么是真的，你拿什么来训练“在乎”？

第二类：覆盖缺口——模型训练中没有见过的场景，行为不可预测。Dawn Song2018年对抗样本，本质覆盖缺口武器化利用。你的“奖励函数”还是你的吗？

第三类：LLM评判者的脆弱性——用模型评判另一个模型输出，引入新不透明优化目标。Soumith在维也纳说“没有好用的评测指标”，正是问题另一种表述。

Dragan把失败放在贝叶斯逆向强化学习的框架下统一阐释。但力量不在技术细节，而把过去十年ICML每一个孤立追问——Silver对能力的信念、Gopnik对“智能”定义质疑、Argall对权力分配追问、Ghassemi对数据正义揭露等等连成完整图景。

她用一个不断把杯子举过头顶的机械臂视频结束，收束所有思想浪潮。

关键要点

AI从深度强化学习到AI for Science，始终围绕“优化什么”展开，每场演讲均指向奖励函数、目标定义与对齐问题。
十年轨迹：从Silver“算法够用”到Dragan“奖励函数由谁写”，学科从相信算法解决一切，转向自我质疑并回到人本身。
核心追问反复出现：谁定义规则（数据标签、人类反馈、奖励函数）、为谁服务（利益、生命伦理、权力分配）、付出谁代价（覆盖缺口、偏差、结构性不平等）。
技术进步与认知滞后形成剪刀差：能力提升掩盖脆弱性与伦理问题，需从根本上反思“智能”与“解决”的定义。
最终结论：AI本质是人构建的系统，问题回归人——谁在写规则、为了谁的利益、又付出了谁的代价。

意义与影响

这十场演讲如时间胶囊，记录AI学科从技术狂热到伦理觉醒的倒带。它们不仅为行业提供反思镜子，更推动了现实讨论：从算法瓶颈转向数据与对齐瓶颈，从“如何做”转向“该为谁做”。

在2025年Gemini等前沿模型落地加速的时代，这些思想为构建更负责任的AI提供了框架——强调透明目标、权力平衡与数据正义。行业可以从中汲取教训：技术进步不能替代对人本身的尊重。只有持续追问“为谁而算”，AI才能真正服务人类，而非反噬之。

AI科技评论认为，这些演讲预示未来：AI将不再是“摆平一切”的黑箱，而是开放、可质疑、可对齐的系统。十周年ICML，正是这一思想浪潮的见证，也为下一浪潮奠基。

查看原文 →leiphone.com