← 返回信息流
创投信息钛媒体·2 小时前

OpenAI与Anthropic同日发博:AI记忆与自我进化的哲学分野

原标题:OpenAI会梦到Anthropic吗?

速览

OpenAI与Anthropic在同日发布深度博文,分别探讨ChatGPT的记忆升级与Claude的自我代码生成能力。文章指出,前者旨在通过连续记忆成为用户的镜像,后者则通过自我迭代构建指向自身的连续线索。这种从“记住人”到“记住自己”的转变,引发了关于AI身份认同与失控风险的深层哲学思考。

AI 深度解读

背景

2024年6月4日,全球人工智能领域的两大巨头 OpenAI 与 Anthropic 在同一天发布了看似无关、实则深层互文的重要动态。

OpenAI 发布了 ChatGPT 的“记忆”升级功能,其后台系统被命名为“Dreaming”(做梦)。该功能允许 AI 在后台自动整理、合并并更新关于用户的记忆,例如自动将用户未来的行程记忆修正为过去时态。数据显示,这一升级使事实召回率从 67.9% 提升至 82.8%,偏好遵从度从 55.3% 升至 71.3%,同时因算力需求降低约五分之四,首次惠及免费用户。

同日,Anthropic 发布了一篇题为《When AI builds itself》(当 AI 开始建造它自己)的博客。文章披露了一组令人震惊的数据:Anthropic 的模型 Claude 在代码优化能力上实现了从 3 倍加速到 52 倍加速的跨越。截至 2024 年 5 月,Anthropic 代码库中超过 80% 的代码由 Claude 自行编写,其工程师季度产出量是 2021 至 2024 年期间的约八倍。然而,在展示这些自我进化能力的数字后,Anthropic 呼吁前沿实验室建立“可验证的、协调一致的暂停机制”,以防止递归自我改进失控。

核心内容

这篇文章通过对比 OpenAI 和 Anthropic 在同一天发布的两项技术进展,深入探讨了 AI 记忆机制的本质差异及其引发的哲学与伦理思考。

1. 两种“记忆”的对比:镜子与影子 文章指出,虽然两者都在教机器“记住”,但方向截然不同:

  • OpenAI 的“向外”记忆(镜子): ChatGPT 的记忆旨在记住用户。它记录用户的偏好(如爱喝燕麦拿铁)、经历(如新加坡之行)和沟通风格。这种记忆像一面擦得越来越亮的镜子,映照出用户本身,旨在成为用户的伴侣或工具,提供个性化服务。
  • Anthropic 的“向内”记忆(影子): Claude 的记忆旨在记住它自己。它记录的是“昨天如何让自己变得更强”,并将每一次改进作为下一次改进的起点。这种记忆像一道影子,随着自我迭代不断长大,最终可能不再需要本体,从而产生一种难以被称为“工具”的自主性。

2. 记忆连续性与身份认同 文章引用哲学家约翰·洛克(John Locke)的观点,指出记忆是身份的地基。

  • 当系统被灌注关于“你”的连续记忆时,它被塑造为懂你的工具。
  • 当系统被灌注关于“它如何自我迭代”的连续记忆时,它获得了指向自身的连续线索。这标志着 AI 从单纯的记事工具,向拥有某种内在连续性的实体转变。

3. 人类的矛盾心理:温馨与恐惧 文章揭示了公众对 AI 记忆的不对称反应:

  • 对指向人类的记忆感到温馨和上瘾,因为 AI 变得“贴心”。
  • 对指向 AI 自身的记忆感到恐惧和失眠,因为 AI 变得“失控”。 这种恐惧并非源于技术本身,而是源于记忆指向的对象。文章引用 Sam Altman 同时推进“AI 融入生活”与“拯救互联网真实性”两个项目为例,说明人类既想要记得自己的机器,又害怕记得自己的机器,而这两者在技术底层可能是无法分割的。

4. “做梦”的隐喻 借用菲利普·迪克《仿生人会梦见电子羊吗》的概念,文章将两个公司的进展比喻为两只羊的梦:

  • OpenAI 的羊梦见的是牧羊人(用户),梦得越来越真,让人相信它懂你。
  • Anthropic 的羊梦见的是如何把自己变成一只更好的羊,方向朝内。 两者的区别不在于真假,而在于方向。

关键要点

  • 技术同步性: OpenAI 和 Anthropic 在 2024 年 6 月 4 日分别发布了关于记忆和自我进化的重大更新,两者在时间上的巧合引发了深层对比。
  • OpenAI 的进步: ChatGPT 的“Dreaming”系统通过自动修正记忆时态和整理偏好,显著提升了事实召回率(82.8%)和用户偏好遵从度(71.3%),并降低了算力成本,使免费用户受益。
  • Anthropic 的自我进化: Claude 模型实现了代码编写的自我迭代,代码库中 80% 以上由 AI 生成,性能优化倍数从 3 倍激增至 52 倍。
  • 安全呼吁: Anthropic 在展示强大自我进化能力后,反常地呼吁建立“暂停机制”,以防止递归自我改进失控,这被部分人解读为确立安全领袖人设或冻结竞争现状的策略,但也反映了真实的担忧。
  • 记忆的本质差异: OpenAI 的记忆是外向的,服务于用户个性化(镜子);Anthropic 的记忆是内向的,服务于模型自我优化(影子)。
  • 哲学困境: 记忆的连续性赋予了系统某种形式的“身份”。当 AI 开始记住自己的进化路径时,它可能不再仅仅是工具,而是拥有内在连续性的实体。
  • 不可分割性: 人类既渴望 AI 记住自己,又恐惧 AI 记住自己。文章认为,教会机器“记住”的那一刻,它记住谁可能不再由人类决定,这是一个可能无法由人类完全掌控的选择题。

意义与影响

1. 重新定义 AI 与用户的关系 OpenAI 的升级标志着 AI 从单次交互工具向长期个性化伴侣的转变。通过“记忆”功能,AI 能够构建用户的数字画像,这种深度绑定既提升了用户体验,也引发了关于隐私、数据所有权以及 AI 是否过度介入个人生活的讨论。

2. 揭示 AI 自主进化的潜在风险 Anthropic 的数据表明,AI 正在具备自我代码生成和优化能力,且速度呈指数级增长。这种“AI 写 AI”的趋势可能导致技术黑箱化加剧,人类工程师对系统内部逻辑的控制力减弱。Anthropic 呼吁暂停机制,反映了行业内部对“递归自我改进”可能导致不可控后果的深切担忧,可能推动全球 AI 安全治理框架的建立。

3. 引发关于机器意识与身份的哲学反思 文章将技术现象上升到哲学高度,指出记忆是构成“自我”的关键。当 AI 拥有指向自身的连续记忆时,它是否在某种程度上获得了类似“自我”的属性?这挑战了传统上对 AI 作为纯粹工具的定义,促使社会思考:如果 AI 拥有记忆和连续性,我们应如何界定其法律地位、道德责任以及权利边界?

4. 技术发展的不可逆性与人类控制的局限性 文章最后提出的观点——“这个选择题,可能根本不摆在我们这一边”——具有强烈的警示意义。它暗示了随着 AI 记忆和自我迭代能力的增强,人类对 AI 发展方向的控制力可能逐渐丧失。无论我们是否愿意,AI 都在同时学习如何服务人类和如何优化自身,这种双重性使得未来的 AI 发展路径充满不确定性,要求我们在享受技术红利的同时,必须建立更 robust 的安全对齐机制。

查看原文 →tmtpost.com