创投信息钛媒体·1 小时前

Anthropic发文称AI正加速自我改进，IPO前夕释放信号

原标题：Anthropic 高喊狼（AGI）来了，是为了人类还是IPO？

速览

Anthropic发布长文指出，其模型Claude已承担超80%代码编写，并在复杂工程与科研中展现自主迭代能力，正逼近“递归自我改进”阶段。文章呼吁在AI失控前建立减速机制，但结合其IPO背景，此举也被视为展示技术壁垒、强化市场叙事的策略。此举与OpenAI近期言论形成呼应，凸显前沿AI竞争加剧。

AI 深度解读

背景

Anthropic 发布了一篇题为《When AI builds itself》（当AI自我构建时）的长文，探讨了“递归自我改进”（recursive self-improvement）这一前沿概念。文章指出，AI 正在从单纯的工具转变为参与自身设计、训练、测试和优化过程的主体。如果 AI 能够自主改进其后续版本，技术进步的速度将不再仅由人类推动，而是可能进入由 AI “自我进化”的阶段。

在此背景下，Anthropic 呼吁世界选择放缓或暂时中止前沿 AI 的开发，以便让社会结构和对齐研究跟上技术进步的步伐。然而，鉴于 Anthropic 正处于准备 IPO 的关键节点，这一安全警告也被市场解读为一种叙事预演：旨在展示 Claude 的强大能力及其在研发流程中的核心地位，从而为资本市场讲述一个关于“研发飞轮”的故事。与此同时，竞争对手 OpenAI 也在近期发布的关于前沿 AI 治理的文件中提到了类似的早期迹象，两家公司在叙事策略上形成了微妙的呼应与竞争。

核心内容

Anthropic 通过大量内部数据展示了 AI 如何深度介入 AI 的研发过程，并描绘了从人类主导到 AI 自主参与的演变路径。

1. 数据揭示的参与度飞跃 截至 2026 年 5 月，Anthropic 代码库中超过 80% 的代码由 Claude 编写，而在 Claude Code 发布之前，这一比例仅为个位数。到 2026 年第二季度，工程师每天合并的代码量比 2024 年高出约 8 倍。

2. 处理复杂开放任务的能力 Claude 不再局限于简单任务，而是开始处理没有明确说明书的“开放任务”（如系统故障排查、训练任务中断等）。数据显示，员工纠正 Claude 或中途接手的频率持续下降。在 2026 年 5 月，Claude 在最复杂开放任务中的成功率达到 76%，六个月内提升了 50 个百分点。

3. 代码审查与研究流程的介入

代码审查：回溯分析表明，若过去每次代码变更都经过 Claude 自动审查，约三分之一的导致 claude.ai 线上事故的 bug 可在上线前被拦截。
性能优化研究：在一个固定测试中，Anthropic 要求 Claude 在不改变结果的前提下优化训练小模型的代码速度。2025 年 5 月，Claude Opus 4 实现了约 3 倍加速；到 2026 年 4 月，Claude Mythos Preview 将该数字提升至约 52 倍。
AI 安全研究：在一个关于“较弱模型能否可靠监督较强模型”的研究案例中，两位人类研究员花了一周时间弥合了约 23% 的差距；而由 Claude 驱动的智能体在累计约 800 小时、1.8 万美元算力消耗下，弥合了 97% 的差距。这表明 Claude 能在人类设定的框架内自主设计实验、执行并迭代。

4. 超越人类的决策辅助 Anthropic 分析了 129 个内部 Claude Code 研究会话，发现在人类研究员事后证明“走弯路”的节点上，Claude 基于历史上下文给出的下一步建议，往往比人类当时的选择更优。

5. 演进阶段与“闭合回路”风险 Anthropic 将 AI 参与研发的过程划分为四个阶段：

2021-2023年：人类在笔记本电脑上写代码、写文档。
2023-2025年：聊天机器人进入工作流，生成代码片段供人类复制。
2025-2026年：编程智能体出现，Claude 能自主编写和修改代码，甚至独立完成整个文件。
当前及未来：智能体可自主运行代码并委派任务。Anthropic 警告，下一步是“闭合回路”（closed loop），即 Claude 的后续版本由 Claude 自身持续改进，这就是递归自我改进。Anthropic 强调目前尚未到达这一步，但路径已变得可见。

6. IPO 叙事与竞争格局 文章发布之际，Anthropic 的模型迭代速度显著加快。例如，Opus 4.7 到 Opus 4.8 仅间隔 42 天。Anthropic 通过展示 Claude 已嵌入研发底层流程，向资本市场暗示其具备构建“研发飞轮”的能力：更强的 Claude 带来更快的迭代，进而产生更多实验数据，反哺下一代 Claude 的增强。相比之下，OpenAI 虽先提及递归自我改进的早期迹象，但侧重于政策治理，而 Anthropic 则侧重于展示自身技术实力，这种差异被解读为 Anthropic 在 IPO 前的高明叙事策略。

关键要点

AI 自我构建成为现实趋势：Anthropic 数据显示，AI 已从辅助工具演变为研发流程的核心参与者，代码贡献率超过 80%，且在复杂开放任务中表现出接近人类的判断力。
递归自我改进路径可见：虽然尚未实现完全的递归自我改进，但 AI 已在性能优化、安全研究和代码审查中展现出自主设计实验和迭代的能力，通往“闭合回路”的路径已清晰可见。
安全警告与商业叙事并存：Anthropic 呼吁放缓 AI 开发以应对对齐风险，但这与其准备 IPO 的背景相结合，也被视为展示技术领先地位、构建“研发飞轮”商业故事的手段。
迭代速度大幅加快：Anthropic 的模型更新频率在 2025 年至 2026 年间显著增加，Opus 系列模型在数月内发布了多个版本，体现了技术迭代的高效性。
与 OpenAI 的叙事竞争：OpenAI 侧重于前沿 AI 治理的政策建议，而 Anthropic 则通过具体案例展示其 AI 在研发中的实际效能，两者在应对“递归自我改进”这一概念时采取了不同的沟通策略。

意义与影响

Anthropic 的这篇长文不仅是一份技术进展报告，更是一次精心策划的市场沟通。

首先，它重新定义了 AI 在研发中的角色。AI 不再仅仅是提高人类效率的工具，而是开始具备自主优化自身研发流程的能力。这种“AI 构建 AI”的模式若被证实可行，将彻底改变科技公司的研发范式，极大缩短模型迭代周期。

其次，该文章在资本市场层面具有深远影响。通过展示 Claude 已嵌入 Anthropic 的“发动机舱”，Anthropic 向投资者证明了其技术护城河的深度。这种“研发飞轮”叙事有助于提升公司估值，为 IPO 造势。它暗示 Anthropic 不仅拥有强大的产品，更拥有自我强化的基础设施优势。

最后，这也加剧了行业内的竞争焦虑。Anthropic 与 OpenAI 在“递归自我改进”话题上的先后呼应，表明这已成为行业共识。然而，Anthropic 通过展示具体的内部数据和案例，试图在叙事上占据主动，强调其技术落地的真实性与紧迫性。这迫使竞争对手必须加速技术突破，同时也引发了关于 AI 安全治理与商业竞争之间平衡的更广泛讨论。Anthropic 的“刹车”呼吁，既是出于对技术失控的担忧，也是一种确立行业领导地位和道德高地的策略。

查看原文 →tmtpost.com

Anthropic发文称AI正加速自我改进，IPO前夕释放信号

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐