AI不“聪明”,人工智能下一步怎么走?
速览
尽管AI在特定任务上表现惊人,但它缺乏真正的理解和常识,不是“聪明”。研究者正转向神经符号系统、世界模型等新范式,以求突破当前深度学习的局限。未来AI可能更接近人类推理,但也面临数据、计算和伦理挑战。
AI 深度解读
背景
Yann LeCun 是人工智能领域的领先人物之一,曾在 Meta(Facebook 母公司)任职十年,担任首席 AI 科学家,2025 年离职后在巴黎创立 Advanced Machine Intelligence Labs(AMI Labs)。LeCun 长期致力于开发超越当前大型语言模型(LLMs)的人工智能系统,其目标是构建更接近人类或动物级别智能的灵活 AI,以解决现实世界中的复杂任务。
核心内容
Yann LeCun 在维瓦科技(VivaTech,法国领先科技大会)会场接受采访时表示,当前的人工智能系统,如 OpenAI 的 ChatGPT、Anthropic 的 Claude 和 Google 的 Gemini,尚未能达到人类或动物级别的理解物理世界的能力。他指出,人类或动物(如老鼠)在理解物理世界的灵活性上仍远超现有 AI。
LeCun 强调,当前 LLM 擅长代码编写、数学问题和文本生成,但这些任务是定义明确、可预测的。“它们基本上只是积累知识……它们可以 regurgitate(复述)某些内容,你训练它们复述,但它们并不特别聪明。没有底层理解。”他认为,LLM 无法处理真实世界中纷繁复杂的结果,因为它们不具备应对真实世界数据的机制。
LeCun 通过笔尖垂直放置演示,询问如果放手会发生什么。幼儿会自然知道笔会倒,但人类无法精确预测方向。LLM 可能基于训练数据统计模式生成单一预测,但该预测几乎肯定错误,因为它没有真正理解物理现实。
AMI Labs 正在开发名为 Joint Embedding Predictive Architecture(JEPA)的全新架构,以应对此类问题。该架构创建现实世界的抽象,使 AI 能够评估行动的后果。创建抽象涉及复杂数学,但本质上会过滤无用信息,仅保留世界的有用图像。在笔例中,AI 会认识到没有必要预测笔的倒落方向。
LeCun 认为,构建更灵活的人工智能是机器人产业优先事项。数十亿美元已投入研发人形机器人,但训练它们安全执行家务(如熨烫、堆洗碗机)仍困难且昂贵。他断言,LLM “在很大程度上对机器人毫无用处”,单纯扩展 LLM 无法达到超人类智能。
人工智能行业多数人同意这一观点。牛津大学应用人工智能教授、其应用 AI 实验室主任 Ingmar Posner 亦持相同看法。他指出,未来十年将聚焦于能解释世界的系统,“你需要模型能够回答诸如‘什么重要?什么导致什么?如果我换个动作会怎样?’等问题”。
Posner 和其约 10 位研究人员已在四个方向开发替代 AI 形式,属于“世界模型”(World Models)松散类别。该领域可追溯至 2018 年 David Ha 和 Jürgen Schmidhuber 的论文,其洞见是:借助机器学习和算力进步,AI 可以通过学习世界的“心理”模拟来掌握任务执行。
自 2018 年起,该理念催生大量研究,包括 Google 的 Dreamer World Model。去年,Dreamer 变体通过想象未来场景帮助决策,已在 Minecraft 游戏中学会收集钻石。Posner 的团队正开发“机制世界模型”,以高效组织知识:“你需要系统能够分隔和组织知识,使其在需要时能够被召回、组合和修改。”
Posner 补充,开发此类新型模型需要多年时间。他引用 2017-2018 年情景:“当时有人问,ChatGPT 式的东西何时出现?他们会说‘几十年’。”ChatGPT 正式版于 2022 年 11 月推出。
DeepMind(Alphabet 旗下)也在开发 Genie 模型;伦敦的 Wayve 推出 Gaia 系统;Fei-Fei Li(AI 先驱、斯坦福大学教授)于 2023 年在旧金山创立 World Labs,聚焦新 AI 模型。
AMI Labs 将在今年余下时间优化 JEPA 模型,明年首先在工业场景中应用。若成功,“最终我们将拥有通用泛型智能系统,几乎适用于世界上任何事物,只需极少训练或微调”。
在机器人独立运营的世界中,LeCun 指出人类仍需“弄清楚要问什么问题、要构建什么、要创造什么,这才是真正人类的那部分”。AI 将为人类工作,“我们与未来 AI 系统的交互,将类似于行业领袖或政治领导人与其助手(多数更聪明)的互动”。
关键要点
- Yann LeCun 认为现有 LLM 如 ChatGPT、Claude、Gemini 缺乏对物理世界的真实理解,无法解决复杂现实任务;
- JEPA 架构通过创建世界抽象来过滤信息,使 AI 评估行动后果,并拒绝无用预测(如笔倒落方向);
- 机器人产业亟需更灵活 AI,而 LLM 在家务等真实场景中“几乎毫无用处”,单纯规模化无法实现超人类智能;
- Ingmar Posner 等专家推动世界模型研究,聚焦能解释“原因”和“结果”的系统,以应对 2018 年 Ha-Schmidhuber 等关键洞见;
- AI 开发周期预计长(从 2017-2018 年预估的“数十年”到实际 2022 年推出),但 JEPA 将首先用于工业场景,后期扩展至通用应用;
- 未来人类角色将转向提出问题、构建和创造,AI 作为智能助手协同工作,无需人类主导所有操作。
意义与影响
Yann LeCun 的 AMI Labs 计划直接挑战 LLM 主导的生成式 AI 范式,其 JEPA 架构代表了一种“预测式嵌入”新路径,旨在通过世界模拟实现更通用的智能。这一转向可能重塑机器人与 AI 应用场景,加速人形机器人从实验室玩具向家务伙伴转变,降低家务自动化成本并提升安全性。
对于全球 AI 产业而言,LeCun 的观点强化了对“规模化即智能”神话的质疑,推动研究转向因果推理和物理模拟(如世界模型),而非单纯数据堆砌。这可能缩短从实验室到工业应用的转化周期,并降低机器人训练难度,影响自动驾驶、仓储和制造业的未来布局。
在人类-机器互动层面,LeCun 的预测强调“人类创造力”仍不可替代,AI 将像办公室助手般服务人类,而非取代思考与决策的角色。这有助于缓解技术失控担忧,引导产业伦理讨论聚焦“人类主导”与“协作”的平衡。长期看,JEPA 等模型若落地通用,可能在医疗辅助、科学发现和教育等领域引发变革,但实际落地仍需突破数据隐私、伦理监管和硬件协同等障碍。
