← 返回信息流
AI 资讯雷峰网·4 小时前

十年ICML:AI从“算力万能”到“为谁而算”的十次思想浪潮

原标题:十年ICML,十次思想浪潮,当AI开始问“为谁而算”|ICML2026

速览

这份资讯讲述ICML作为机器学习领域历史最悠久顶级会议,过去十年通过十次关键重磅演讲,展现了AI学科对“真正问题”的思想倒带。从2016年Silver在纽约展示深度强化学习如何将深度网络嫁接到强化学习上,相信算力与工程就能解决一切,到2017年Gelly兑现十年赌约,2025年Anca Dragan在温哥华视频中指出机器人奖励函数偏差的根本——定义的“正确”与人类差异巨大。这些演讲不仅记录算法迭代,更揭示AI从技术高潮走向对“解决”本身质疑,最终回归人本身,包括隐私、脆弱性、目标函数设计与人类价值观对齐。意义在于为读者提供行业轨迹洞察,帮助理解当代AI面临的伦理与实用挑战。

AI 深度解读

十年ICML,十次思想浪潮,当AI开始问“为谁而算”|ICML2026

作者|吴思梦
编辑|岑峰

背景

ICML(International Conference on Machine Learning)是机器学习领域历史最悠久的顶级会议,2016年6月在纽约举办的第33届会议标志着十周年。十年来,该会议每年重磅的Keynote演讲如同时间胶囊,记录着AI学科对“真正问题”的反思与演进。从深度强化学习到AI for Science,再到伦理与对齐,演讲主题从“算法如何摆平一切”转向“算法本身是否值得信任”。

AI科技评论对十个关键演讲进行分析,发现行业轨迹清晰:AI从盲目乐观转向自我质疑,最终回到“人本身”。这些演讲不仅展示技术迭代,更反映整个学科对“谁在定义规则、为谁服务、付出谁的代价”这一根本追问的深入。

核心内容

2016年6月,纽约。David Silver在ICML讲台上用66页幻灯片,从Q-Learning一路推到AlphaGo。他传递出信念:深度网络嫁接到强化学习上,通用智能的涌现只是算力和工程问题。彼时AlphaGo仅三个月前在首尔4∶1击败李世石。

十年后,2025年7月,温哥华。Anca Dragan——Google DeepMind Gemini后训练联合负责人,在现场播放一段机器人机械臂视频:手臂举起杯子太高,手伸进压低它,松开后又举上去。“不是机器人笨,”她说,“是奖励函数在逼它做它认为‘正确’的事。只是我们定义的‘正确’和人类想的‘正确’,根本不在一个频道上。”

从Silver到Dragan,ICML每年的演讲记录学科对“真正问题”的倒带。AI从相信算法能解决一切,走向对“解决”本身的自我质疑;从目标函数视为既定真理,到撞向最核心现实——谁在写规则、为了谁的利益、又付出了谁的代价。最终回到问题的起点:人本身。

以下是十个声音,逐一展开。

2016·纽约——David Silver:深度强化学习的黎明

David Silver的演讲本质是路线图:从Q-Learning到Policy Gradient,从Actor-Critic到Experience Replay,再到AlphaGo的蒙特卡洛树搜索与深度价值网络融合。核心逻辑清晰:深度网络负责“看”,强化学习负责“决策”,合在一起就是一个通用问题求解器。

他观点是:如果奖励函数定义得足够好,强化学习就能在任何任务上超越人类。他展示AlphaGo技术架构,相信智能本质是最大化累积奖励。棋盘上“赢”是无需质疑的目标,物理世界中自动驾驶、机器人控制、蛋白质折叠等均可归约为同一形式。

当年AlphaGo胜利让公众和资本产生错觉:既然AI能在围棋中击败人类,解决一切只是算力和工程问题。

2017·悉尼——Sylvain Gelly & David Silver:一个精准兑现的十年赌约

2017年ICML Test of Time Award颁给Gelly、Silver等人2007年论文:将在线知识(MCTS树搜索)和离线知识(经验价值函数)融合进围棋AI——AlphaGo底层逻辑。

Gelly展示表格:2007-2017年计算机围棋Elo从1800涨到4500。他讲私人故事:十年前与同事打赌,十年内计算机围棋将打败人类职业棋手。2016年AlphaGo击败李世石提前一年兑现。

他还讲验证悖论:更强策略网络使Rollout表现更差,因为好策略剪窄搜索,局部做得越好,全局越易错过。这隐喻将在后续年份反复应验。

最意味深长的是:ICML开幕前两个月,“Attention is All You Need”论文挂arXiv。Transformer提出观点路径,影响深远。那年NIPS、ICML、ICLR加起来超过3000篇论文,此文仅之一。几乎无人知其意义。中国国务院同年7月印发《新一代人工智能发展规划》,AlphaGo余烬未消,宏观图景已近。

2018·斯德哥尔摩——Dawn Song:深度学习是一座沙堡

2018年ICML在寒流中召开,四个月前剑桥分析丑闻曝光。Dawn Song未谈丑闻,谈深度学习系统结构上脆弱。

她展示熊猫图片加噪声后被模型识别为“长臂猿”;用查询API偷商业化图像分类模型,无需侵入服务器,只需发送请求观察输出;训练阶段植入后门:给路牌贴特制贴纸,自动驾驶汽车将停车标志误读为限速标志。

Song认为,能力进步与脆弱性认知之间存在扩大剪刀差。越急于部署模型(如自动驾驶、人脸识别、医疗诊断),危险越大。从2025年回看,Song演讲预言:对抗攻击将演变成Prompt Injection,模型窃取将变成DeepSeek蒸馏OpenAI。预见更深层:一切建立在脆弱地基上。

2019·长滩——Alison Gopnik:那个说“大模型不是智能”的心理学家

2019年AI界围绕OpenAI GPT-2“太危险不能全部公开”展开。同月亚马逊面部识别对深色皮肤女性错误率高31%,Deepfake泛滥。ICML讲台站着一“局外人”——伯克利发展心理学家Alison Gopnik。

Gopnik演讲标题《What Four-year-olds Can Do and AI Can’t (Yet)》。她说,大语言模型不是“智能体”(agent),是“文化技术”(cultural technology)。如写作、印刷术、图书馆,让个体获取人类积累知识的工具。“你问‘GPT比我知道得更多吗’——这个问题本身就是错的。图书馆比我知道得更多吗?图书馆不是一个人。”

对比更锋利:儿童做“真相发现”(truth-seeking)。两岁小孩设计因果实验:挖沙子观察塌陷、把水倒在不同杯子、反复扔勺子确认重力不是随机事件。“ChatGPT不是产生幻觉,它只是不在乎真假。它的目标函数里没有这个维度。”

2023年ChatGPT捏造法庭判例导致律师被处罚,当它给澳大利亚市长编造贿赂罪,Gopnik2019年观点突然掷地有声。

2020·线上——Brenna Argall:当算法进入人的身体,谁在适应谁

2020年ICML本应在维也纳召开,改为Zoom会议,10800人次观看,75个国家。Brenna Argall Keynote主题《Human and Machine Learning for Assistive Autonomy》。

Argall是西北大学Assistive & Restorative Technology Lab负责人。实验室名字声明:技术来辅助和恢复人的能力,不是替代。但她问:当机器和人共享控制权时,谁在适应谁?

传统逻辑是“机器决策,人接受”——自动化越高,人做的事越少。Argall翻转:真正辅助自主,不是让机器做更多决定,而是让人保持对自己身体和行动掌控。她展示共享控制策略:在某些场景机器提供物理支持但人保持决策权;在另一些机器主动预判意图但保留被推翻通道。她量化不同自动化水平下用户的“感知控制感”,把权力分配变为可优化变量。

核心论点涉及分配正义:“每一个自动化决策,都意味着收回人的一部分能动性。辅助自主的核心不是技术问题——是权力如何在人和机器之间分配的问题。”

2020年全世界依赖远程技术和自动化系统,Argall追问有着穿透力:你正在设计的自动化系统,是在增强人的能力,还是悄悄剥夺人的选择?

2021·线上——Daphne Koller:AI制药的数据贫困

2021年mRNA疫苗拯救生命,AlphaFold 2解决蛋白质结构预测问题。AI for Science目光转向。Daphne Koller斯坦福教授、Coursera联合创始人、insitro CEO,把镜头从分子结构转向制药业基础设施。主题《Transforming Drug Discovery using Digital Biology》。

传统药物开发:平均10年、26亿美元、90%失败率。她目标从靶点发现到临床试验预测做全链路数字化。但演讲花大量时间讲:不是算法难,是数据难。

“ImageNet已经做到百万级精确标注,”她说,“制药业最关键的细胞表型数据还停留在手工显微镜观察。”几十年的湿实验数据,格式互不兼容,元数据缺失,“有些还在纸质实验记录本上。”

她展示insitro解决方案:用自动化湿实验室生成大规模、标准化、带有完整元数据的细胞数据,在上面训练机器学习模型。她认为,机器学习工具箱足够好,但制药业数据基础设施停留在前数字化时代。意味着在AI for Science最激动人战场,最急迫瓶颈不是模型架构,而是数据标准化和生产化。

当行业追逐更大模型和更多算力时,她提醒:在真正复杂领域,那些事关生命的领域,数据贫困仍是比算法瓶颈更根本约束。

2022·巴尔的摩——Regina Barzilay:我们是否在解决正确的问题

2022年ICML在巴尔的摩恢复线下。Regina Barzilay MIT CSAIL教授,2017年从乳腺癌中幸存后把研究转向AI+医疗。演讲主题《Solving the Right Problems: Making ML Models Relevant to Healthcare and the Life Sciences》。

她回顾1997年NLP会议:全场两三百人,大部分基于规则系统。二十年后神经方法横扫一切。但问不在议程上的问题:这二十年多少论文解决的是最终被证明不相关的问题?

例子来自医疗:大量机器学习论文优化医院再入院率预测,这是Medicare公开追踪、数据干净漂亮的指标。但在临床现实中,再入院率和医疗质量相关性远比想象低。一堆论文在优化一个和真实世界“相关”但远不等于真实世界代理变量。“我们非常擅长在别人定义的问题上跑分。定义正确的问题,才是最难的部分。”

演讲日期2022年7月。四个月后ChatGPT发布。Barzilay问“我们是否在解决正确的问题”,指医疗AI评价指标错位。但未来这个问题将变成对整个领域的提问。

2023·檀香山——Marzyeh Ghassemi:健康标签里的结构性暴力

2023年ICML在檀香山。ChatGPT发布六个月后GPT-4上线。

Marzyeh Ghassemi多伦多大学和MIT教授,Healthy ML Lab负责人。演讲主题《Taking the Pulse Of Ethical ML in Health》。她放一张胸部X光片。

实验室用700万张胸部X光片训练模型,判断病人是否“健康到可以回家”。准确率很高,State-of-the-art。然后问:能部署吗?答案是不能。因为训练数据中,“健康”标签分布不均等。有色人种患者更少被标记为“无异常”——不是他们客观上更不健康,而是来急诊室时通常已经病得更重。

这是几十年的结构性不平等在数据中的投影。如果模型部署,它会系统性把更多数族裔患者留在急诊室——医生甚至不会意识到,因为模型在验证集上表现“好”。

值得注意的是,同次会议上,OpenAI的John Schulman讲“RLHF中的代理目标”。一个讲大模型对齐,一个讲医疗模型不对齐。后者更不性感,但关乎现实生命伦理。Ghassemi揭示:在某些场景,你连用来训练“正确”标签的数据都是错的。不是模型问题,是数据里的历史已替你做了道德选择。

2024·维也纳——Soumith Chintala:开源不是慈善,是战略

2024年ICML回到维也纳,距原定2020年召开已过去四年。Soumith Chintala PyTorch缔造者、Meta VP。演讲拆流行叙事:开源不是在做好事。“让你的互补品大众化”(Commoditize your complement)引用商业格言。如果开源对竞争对手伤害远大于对你伤害,那就开源它。这不是道德,是利益计算。

他用六个角色画开源争议利益格局:学者缺算力不满闭源访问限制;大公司怕担责又想蹭开源创新;AGI创业公司急着在钱烧完前做突破;垂直AI创业者不在乎开源反正领域窄;Reddit黑客想以崇高之名行破坏之实;普通人只想安静用产品。每一方都在跑自己的多目标优化函数。

关键判断关于AGI时间线:“如果你觉得AGI两年内就会来,你对开放的态度自然会不一样。”关于“智能何时到来”的假设,本身就是一个被忽视的意识形态变量,直接决定“该做什么”的立场。Soumith结论是“我毫无歉意地站在开放一边”,理由不是道德,而是相信AGI还很远,开放能加速一切。在充斥崇高话语和末日修辞的AI讨论,有人承认选择源于可被质疑假设——这本身构成诚实。

2025·温哥华——Anca Dragan:奖励函数究竟是谁写的

Anca Dragan演讲标题《What to optimize for – from robot arms to frontier AI》。她没有答案,给出一套分类法,将过去十年所有被忽视追问收束为框架。

她把AI目标失败归为三类。

第一类:人类反馈中的系统性偏差——标注者会无意识偏好某种表达方式、某种政治立场,模型学会的不是“好”而是“标注者认为好”。Gopnik2019年说“它不在乎真假”,但如果标注者也不知道什么是真的,你拿什么来训练“在乎”?

第二类:覆盖缺口——模型训练中没有见过的场景,行为不可预测。Dawn Song2018年对抗样本,本质覆盖缺口武器化利用。你的“奖励函数”还是你的吗?

第三类:LLM评判者的脆弱性——用模型评判另一个模型输出,引入新不透明优化目标。Soumith在维也纳说“没有好用的评测指标”,正是问题另一种表述。

Dragan把失败放在贝叶斯逆向强化学习的框架下统一阐释。但力量不在技术细节,而把过去十年ICML每一个孤立追问——Silver对能力的信念、Gopnik对“智能”定义质疑、Argall对权力分配追问、Ghassemi对数据正义揭露等等连成完整图景。

她用一个不断把杯子举过头顶的机械臂视频结束,收束所有思想浪潮。

关键要点

  • AI从深度强化学习到AI for Science,始终围绕“优化什么”展开,每场演讲均指向奖励函数、目标定义与对齐问题。
  • 十年轨迹:从Silver“算法够用”到Dragan“奖励函数由谁写”,学科从相信算法解决一切,转向自我质疑并回到人本身。
  • 核心追问反复出现:谁定义规则(数据标签、人类反馈、奖励函数)、为谁服务(利益、生命伦理、权力分配)、付出谁代价(覆盖缺口、偏差、结构性不平等)。
  • 技术进步与认知滞后形成剪刀差:能力提升掩盖脆弱性与伦理问题,需从根本上反思“智能”与“解决”的定义。
  • 最终结论:AI本质是人构建的系统,问题回归人——谁在写规则、为了谁的利益、又付出了谁的代价。

意义与影响

这十场演讲如时间胶囊,记录AI学科从技术狂热到伦理觉醒的倒带。它们不仅为行业提供反思镜子,更推动了现实讨论:从算法瓶颈转向数据与对齐瓶颈,从“如何做”转向“该为谁做”。

在2025年Gemini等前沿模型落地加速的时代,这些思想为构建更负责任的AI提供了框架——强调透明目标、权力平衡与数据正义。行业可以从中汲取教训:技术进步不能替代对人本身的尊重。只有持续追问“为谁而算”,AI才能真正服务人类,而非反噬之。

AI科技评论认为,这些演讲预示未来:AI将不再是“摆平一切”的黑箱,而是开放、可质疑、可对齐的系统。十周年ICML,正是这一思想浪潮的见证,也为下一浪潮奠基。

查看原文 →leiphone.com