Anthropic发文称AI正加速自我改进,IPO前夕释放信号
速览
Anthropic发布长文指出,其模型Claude已承担超80%代码编写,并在复杂工程与科研中展现自主迭代能力,正逼近“递归自我改进”阶段。文章呼吁在AI失控前建立减速机制,但结合其IPO背景,此举也被视为展示技术壁垒、强化市场叙事的策略。此举与OpenAI近期言论形成呼应,凸显前沿AI竞争加剧。
AI 深度解读
背景
Anthropic 发布了一篇题为《When AI builds itself》(当AI自我构建时)的长文,探讨了“递归自我改进”(recursive self-improvement)这一前沿概念。文章指出,AI 正在从单纯的工具转变为参与自身设计、训练、测试和优化过程的主体。如果 AI 能够自主改进其后续版本,技术进步的速度将不再仅由人类推动,而是可能进入由 AI “自我进化”的阶段。
在此背景下,Anthropic 呼吁世界选择放缓或暂时中止前沿 AI 的开发,以便让社会结构和对齐研究跟上技术进步的步伐。然而,鉴于 Anthropic 正处于准备 IPO 的关键节点,这一安全警告也被市场解读为一种叙事预演:旨在展示 Claude 的强大能力及其在研发流程中的核心地位,从而为资本市场讲述一个关于“研发飞轮”的故事。与此同时,竞争对手 OpenAI 也在近期发布的关于前沿 AI 治理的文件中提到了类似的早期迹象,两家公司在叙事策略上形成了微妙的呼应与竞争。
核心内容
Anthropic 通过大量内部数据展示了 AI 如何深度介入 AI 的研发过程,并描绘了从人类主导到 AI 自主参与的演变路径。
1. 数据揭示的参与度飞跃 截至 2026 年 5 月,Anthropic 代码库中超过 80% 的代码由 Claude 编写,而在 Claude Code 发布之前,这一比例仅为个位数。到 2026 年第二季度,工程师每天合并的代码量比 2024 年高出约 8 倍。
2. 处理复杂开放任务的能力 Claude 不再局限于简单任务,而是开始处理没有明确说明书的“开放任务”(如系统故障排查、训练任务中断等)。数据显示,员工纠正 Claude 或中途接手的频率持续下降。在 2026 年 5 月,Claude 在最复杂开放任务中的成功率达到 76%,六个月内提升了 50 个百分点。
3. 代码审查与研究流程的介入
- 代码审查:回溯分析表明,若过去每次代码变更都经过 Claude 自动审查,约三分之一的导致 claude.ai 线上事故的 bug 可在上线前被拦截。
- 性能优化研究:在一个固定测试中,Anthropic 要求 Claude 在不改变结果的前提下优化训练小模型的代码速度。2025 年 5 月,Claude Opus 4 实现了约 3 倍加速;到 2026 年 4 月,Claude Mythos Preview 将该数字提升至约 52 倍。
- AI 安全研究:在一个关于“较弱模型能否可靠监督较强模型”的研究案例中,两位人类研究员花了一周时间弥合了约 23% 的差距;而由 Claude 驱动的智能体在累计约 800 小时、1.8 万美元算力消耗下,弥合了 97% 的差距。这表明 Claude 能在人类设定的框架内自主设计实验、执行并迭代。
4. 超越人类的决策辅助 Anthropic 分析了 129 个内部 Claude Code 研究会话,发现在人类研究员事后证明“走弯路”的节点上,Claude 基于历史上下文给出的下一步建议,往往比人类当时的选择更优。
5. 演进阶段与“闭合回路”风险 Anthropic 将 AI 参与研发的过程划分为四个阶段:
- 2021-2023年:人类在笔记本电脑上写代码、写文档。
- 2023-2025年:聊天机器人进入工作流,生成代码片段供人类复制。
- 2025-2026年:编程智能体出现,Claude 能自主编写和修改代码,甚至独立完成整个文件。
- 当前及未来:智能体可自主运行代码并委派任务。Anthropic 警告,下一步是“闭合回路”(closed loop),即 Claude 的后续版本由 Claude 自身持续改进,这就是递归自我改进。Anthropic 强调目前尚未到达这一步,但路径已变得可见。
6. IPO 叙事与竞争格局 文章发布之际,Anthropic 的模型迭代速度显著加快。例如,Opus 4.7 到 Opus 4.8 仅间隔 42 天。Anthropic 通过展示 Claude 已嵌入研发底层流程,向资本市场暗示其具备构建“研发飞轮”的能力:更强的 Claude 带来更快的迭代,进而产生更多实验数据,反哺下一代 Claude 的增强。相比之下,OpenAI 虽先提及递归自我改进的早期迹象,但侧重于政策治理,而 Anthropic 则侧重于展示自身技术实力,这种差异被解读为 Anthropic 在 IPO 前的高明叙事策略。
关键要点
- AI 自我构建成为现实趋势:Anthropic 数据显示,AI 已从辅助工具演变为研发流程的核心参与者,代码贡献率超过 80%,且在复杂开放任务中表现出接近人类的判断力。
- 递归自我改进路径可见:虽然尚未实现完全的递归自我改进,但 AI 已在性能优化、安全研究和代码审查中展现出自主设计实验和迭代的能力,通往“闭合回路”的路径已清晰可见。
- 安全警告与商业叙事并存:Anthropic 呼吁放缓 AI 开发以应对对齐风险,但这与其准备 IPO 的背景相结合,也被视为展示技术领先地位、构建“研发飞轮”商业故事的手段。
- 迭代速度大幅加快:Anthropic 的模型更新频率在 2025 年至 2026 年间显著增加,Opus 系列模型在数月内发布了多个版本,体现了技术迭代的高效性。
- 与 OpenAI 的叙事竞争:OpenAI 侧重于前沿 AI 治理的政策建议,而 Anthropic 则通过具体案例展示其 AI 在研发中的实际效能,两者在应对“递归自我改进”这一概念时采取了不同的沟通策略。
意义与影响
Anthropic 的这篇长文不仅是一份技术进展报告,更是一次精心策划的市场沟通。
首先,它重新定义了 AI 在研发中的角色。AI 不再仅仅是提高人类效率的工具,而是开始具备自主优化自身研发流程的能力。这种“AI 构建 AI”的模式若被证实可行,将彻底改变科技公司的研发范式,极大缩短模型迭代周期。
其次,该文章在资本市场层面具有深远影响。通过展示 Claude 已嵌入 Anthropic 的“发动机舱”,Anthropic 向投资者证明了其技术护城河的深度。这种“研发飞轮”叙事有助于提升公司估值,为 IPO 造势。它暗示 Anthropic 不仅拥有强大的产品,更拥有自我强化的基础设施优势。
最后,这也加剧了行业内的竞争焦虑。Anthropic 与 OpenAI 在“递归自我改进”话题上的先后呼应,表明这已成为行业共识。然而,Anthropic 通过展示具体的内部数据和案例,试图在叙事上占据主动,强调其技术落地的真实性与紧迫性。这迫使竞争对手必须加速技术突破,同时也引发了关于 AI 安全治理与商业竞争之间平衡的更广泛讨论。Anthropic 的“刹车”呼吁,既是出于对技术失控的担忧,也是一种确立行业领导地位和道德高地的策略。
