创投信息钛媒体·2 小时前

OpenAI与Anthropic同日发博：AI记忆与自我进化的哲学分野

原标题：OpenAI会梦到Anthropic吗？

速览

OpenAI与Anthropic在同日发布深度博文，分别探讨ChatGPT的记忆升级与Claude的自我代码生成能力。文章指出，前者旨在通过连续记忆成为用户的镜像，后者则通过自我迭代构建指向自身的连续线索。这种从“记住人”到“记住自己”的转变，引发了关于AI身份认同与失控风险的深层哲学思考。

AI 深度解读

背景

2024年6月4日，全球人工智能领域的两大巨头 OpenAI 与 Anthropic 在同一天发布了看似无关、实则深层互文的重要动态。

OpenAI 发布了 ChatGPT 的“记忆”升级功能，其后台系统被命名为“Dreaming”（做梦）。该功能允许 AI 在后台自动整理、合并并更新关于用户的记忆，例如自动将用户未来的行程记忆修正为过去时态。数据显示，这一升级使事实召回率从 67.9% 提升至 82.8%，偏好遵从度从 55.3% 升至 71.3%，同时因算力需求降低约五分之四，首次惠及免费用户。

同日，Anthropic 发布了一篇题为《When AI builds itself》（当 AI 开始建造它自己）的博客。文章披露了一组令人震惊的数据：Anthropic 的模型 Claude 在代码优化能力上实现了从 3 倍加速到 52 倍加速的跨越。截至 2024 年 5 月，Anthropic 代码库中超过 80% 的代码由 Claude 自行编写，其工程师季度产出量是 2021 至 2024 年期间的约八倍。然而，在展示这些自我进化能力的数字后，Anthropic 呼吁前沿实验室建立“可验证的、协调一致的暂停机制”，以防止递归自我改进失控。

核心内容

这篇文章通过对比 OpenAI 和 Anthropic 在同一天发布的两项技术进展，深入探讨了 AI 记忆机制的本质差异及其引发的哲学与伦理思考。

1. 两种“记忆”的对比：镜子与影子 文章指出，虽然两者都在教机器“记住”，但方向截然不同：

OpenAI 的“向外”记忆（镜子）： ChatGPT 的记忆旨在记住用户。它记录用户的偏好（如爱喝燕麦拿铁）、经历（如新加坡之行）和沟通风格。这种记忆像一面擦得越来越亮的镜子，映照出用户本身，旨在成为用户的伴侣或工具，提供个性化服务。
Anthropic 的“向内”记忆（影子）： Claude 的记忆旨在记住它自己。它记录的是“昨天如何让自己变得更强”，并将每一次改进作为下一次改进的起点。这种记忆像一道影子，随着自我迭代不断长大，最终可能不再需要本体，从而产生一种难以被称为“工具”的自主性。

2. 记忆连续性与身份认同 文章引用哲学家约翰·洛克（John Locke）的观点，指出记忆是身份的地基。

当系统被灌注关于“你”的连续记忆时，它被塑造为懂你的工具。
当系统被灌注关于“它如何自我迭代”的连续记忆时，它获得了指向自身的连续线索。这标志着 AI 从单纯的记事工具，向拥有某种内在连续性的实体转变。

3. 人类的矛盾心理：温馨与恐惧 文章揭示了公众对 AI 记忆的不对称反应：

对指向人类的记忆感到温馨和上瘾，因为 AI 变得“贴心”。
对指向 AI 自身的记忆感到恐惧和失眠，因为 AI 变得“失控”。这种恐惧并非源于技术本身，而是源于记忆指向的对象。文章引用 Sam Altman 同时推进“AI 融入生活”与“拯救互联网真实性”两个项目为例，说明人类既想要记得自己的机器，又害怕记得自己的机器，而这两者在技术底层可能是无法分割的。

4. “做梦”的隐喻 借用菲利普·迪克《仿生人会梦见电子羊吗》的概念，文章将两个公司的进展比喻为两只羊的梦：

OpenAI 的羊梦见的是牧羊人（用户），梦得越来越真，让人相信它懂你。
Anthropic 的羊梦见的是如何把自己变成一只更好的羊，方向朝内。两者的区别不在于真假，而在于方向。

关键要点

技术同步性： OpenAI 和 Anthropic 在 2024 年 6 月 4 日分别发布了关于记忆和自我进化的重大更新，两者在时间上的巧合引发了深层对比。
OpenAI 的进步： ChatGPT 的“Dreaming”系统通过自动修正记忆时态和整理偏好，显著提升了事实召回率（82.8%）和用户偏好遵从度（71.3%），并降低了算力成本，使免费用户受益。
Anthropic 的自我进化： Claude 模型实现了代码编写的自我迭代，代码库中 80% 以上由 AI 生成，性能优化倍数从 3 倍激增至 52 倍。
安全呼吁： Anthropic 在展示强大自我进化能力后，反常地呼吁建立“暂停机制”，以防止递归自我改进失控，这被部分人解读为确立安全领袖人设或冻结竞争现状的策略，但也反映了真实的担忧。
记忆的本质差异： OpenAI 的记忆是外向的，服务于用户个性化（镜子）；Anthropic 的记忆是内向的，服务于模型自我优化（影子）。
哲学困境： 记忆的连续性赋予了系统某种形式的“身份”。当 AI 开始记住自己的进化路径时，它可能不再仅仅是工具，而是拥有内在连续性的实体。
不可分割性： 人类既渴望 AI 记住自己，又恐惧 AI 记住自己。文章认为，教会机器“记住”的那一刻，它记住谁可能不再由人类决定，这是一个可能无法由人类完全掌控的选择题。

意义与影响

1. 重新定义 AI 与用户的关系 OpenAI 的升级标志着 AI 从单次交互工具向长期个性化伴侣的转变。通过“记忆”功能，AI 能够构建用户的数字画像，这种深度绑定既提升了用户体验，也引发了关于隐私、数据所有权以及 AI 是否过度介入个人生活的讨论。

2. 揭示 AI 自主进化的潜在风险 Anthropic 的数据表明，AI 正在具备自我代码生成和优化能力，且速度呈指数级增长。这种“AI 写 AI”的趋势可能导致技术黑箱化加剧，人类工程师对系统内部逻辑的控制力减弱。Anthropic 呼吁暂停机制，反映了行业内部对“递归自我改进”可能导致不可控后果的深切担忧，可能推动全球 AI 安全治理框架的建立。

3. 引发关于机器意识与身份的哲学反思 文章将技术现象上升到哲学高度，指出记忆是构成“自我”的关键。当 AI 拥有指向自身的连续记忆时，它是否在某种程度上获得了类似“自我”的属性？这挑战了传统上对 AI 作为纯粹工具的定义，促使社会思考：如果 AI 拥有记忆和连续性，我们应如何界定其法律地位、道德责任以及权利边界？

4. 技术发展的不可逆性与人类控制的局限性 文章最后提出的观点——“这个选择题，可能根本不摆在我们这一边”——具有强烈的警示意义。它暗示了随着 AI 记忆和自我迭代能力的增强，人类对 AI 发展方向的控制力可能逐渐丧失。无论我们是否愿意，AI 都在同时学习如何服务人类和如何优化自身，这种双重性使得未来的 AI 发展路径充满不确定性，要求我们在享受技术红利的同时，必须建立更 robust 的安全对齐机制。

查看原文 →tmtpost.com

OpenAI与Anthropic同日发博：AI记忆与自我进化的哲学分野

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐