Sakana AI推出递归自我改进实验室
速览
Sakana AI近日推出了名为递归自我改进(RSI)的实验室项目。该实验室专注于研究如何让AI模型具备自我优化和迭代进化的能力。这一举措标志着AI技术向更高阶的自主学习能力迈出了重要一步。
AI 深度解读
Sakana AI 递归自我改进(RSI)实验室:从“暴力堆料”到“优雅进化”的范式转移
背景
随着全球进入人工智能时代,日本面临着重新夺回全球创新前沿地位的独特机遇。然而,要在 AI 和科学发现领域实现全球领导地位,仅依靠传统的“暴力破解”单体模型(monolithic models)的大规模扩展路径已难以为继。
Sakana AI 指出,历史表明,日本在制造业的主导地位并非源于丰富的自然资源,而是通过对工厂车间制度的根本性重构实现的。通过“持续、复利式自我改进”的理念,日本创造了以更少资源实现更多产出的系统。这一原则同样适用于智能本身:人类认知并非在资源无限的情况下涌现,而是在严格约束下,通过开放式的、复利式的进化过程锻造而成。
在此背景下,Sakana AI 认为在日本构建 AI 提供了终极的设计约束。这种约束迫使研究者放弃对暴力扩展的依赖,转而追求优雅性、适应性和自主性。为此,Sakana AI 宣布正式成立 Sakana AI RSI Lab(递归自我改进实验室),这是一个专门的研究小组,旨在利用 AI 重新设计 AI 的开发流程,推动 AI 系统从静态工具向自主研究人员转变。
核心内容
Sakana AI RSI Lab 并非从零开始,而是建立在 Sakana AI 过去两年积累的丰富研究成果之上。这些成果系统地推动了行业从人工设计的启发式方法向自主的、进化式的优化循环转变。以下是其核心工作脉络:
1. 技术演进路线图
-
LLM-Squared (2024): 与牛津大学和剑桥大学合作开发。该框架开创了由 AI 驱动的自动化流程,允许大语言模型(LLM)发明训练 LLM 的更好方法(即 LLM²)。其成果 DiscoPOP 是一个最先进的偏好优化算法,完全由 LLM 通过代际进化循环发现并编写。这标志着“AI² 范式转变”:AI 模型已强大到可以开始进行研究以改进自身。
-
The Darwin Gödel Machine (2025): 与不列颠哥伦比亚大学(UBC)研究人员合作开发。DGM 通过维护不断演化的智能体变体谱系,使其能够自主重写自身的代码库,从而实现开放的、持续的自我改进。在 SWE-bench 基准测试中,DGM 自动将基线软件工程性能提升了一倍以上,实现了 30 个百分点的绝对提升。
-
ShinkaEvolve (2025): 一个开源框架,展示了在科学发现中程序进化的前所未有的样本效率。利用自适应采样和新颖性过滤,它仅使用 150 个样本就解决了复杂优化问题,并成功生成了一种新颖的负载均衡损失函数,提升了混合专家模型(MoE)的性能。
-
ALE-Agent (2025): Sakana AI 的里程碑式优化智能体,在 AtCoder Heuristic Contest 058 中从 804 名人类参赛者中夺得第一名。它利用大规模的推理时间扩展和从试错失败中提取洞察的自我学习机制,自主推导出了超越人类专家的算法。
-
Digital Red Queen (2026): 与麻省理工学院(MIT)合作,在 Core War 的图灵完备沙盒中建立了开放的对抗性共同进化。在由 LLM 编写竞争代码的进化军备竞赛驱动下,系统触发了复杂软件策略的自主涌现,并展示了惊人的收敛进化形式。这一对抗性沙盒为将 RSI 应用于网络安全奠定了基础,展示了自主智能体如何在动态算法军备竞赛中共同进化以发现、利用和修补漏洞。
-
The AI Scientist (2024–2026): 这是一个具有里程碑意义的系统,能够实现完全自动化的、开放式的科学发现,涵盖从生成想法、运行实验、撰写完整论文到执行同行评审的全过程。该研究在全球范围内获得认可,并于 2026 年 3 月 26 日发表在《自然》(Nature)杂志上。
2. 核心哲学:样本效率而非算力堆砌
贯穿上述进化优化循环的核心纪律是:进步源于思想,而不仅仅是算力(Compute)。
- ShinkaEvolve 仅用 150 个样本就解决了暴力搜索视为不可行的问题。
- ALE-Agent 通过从自身失败中提取结构化教训,而非燃烧更多推理资源,击败了 804 名人类启发式专家。
Sakana AI 致力于构建的不是最消耗算力的自我改进引擎,而是最具样本效率的引擎。其进步应建立在国家级别而非超大规模(hyperscale)的算力预算之上。
3. 指数级主权 AI 的发展轨迹
Sakana AI 描绘了一条摆脱传统 AI 调优中静态、人类束缚限制,迈向自我改进轨迹的路径,分为四个阶段:
- Agent-Native Models(原生智能体模型):构建专为开放式智能体用例设计的基线认知架构和世界模拟器,而非基本的聊天界面。
- The AI Scientist(AI 科学家):部署这些架构以执行端到端的自动化研究,独立扩展科学知识块。
- Recursive Self-Improvement(递归自我改进):达到关键转折点,AI 智能体主动编写、基准测试和验证其自身基础架构的代码,启动自主升级循环。
- Democratized AI(民主化 AI):认为递归自我改进可以在适度、样本高效的算力上实现,从而改变前沿 AI 的地理格局。无法在原始集群规模上竞争的国家、机构和领域,可以开始构建解决自身问题的 AI 系统。这被视为指数级自我改进成为公共产品而非赢家通吃资产的转折点。
关键要点
- 范式转移:Sakana AI 主张从“暴力扩展单体模型”转向“递归自我改进(RSI)”,利用 AI 重新设计 AI 开发流程。
- 日本的优势:利用日本在科学人才和工程文化方面的深厚积累,以及相对于超大规模科技公司的“适度”算力约束,倒逼出更高效、更优雅的 AI 架构。
- 样本效率至上:核心竞争优势在于“样本效率”而非“算力堆砌”。通过进化算法和自适应采样,用极少的资源实现复杂问题的解决和模型优化。
- 闭环生态:构建“Agent-Native Models 赋能 AI Scientist,AI Scientist 反过来构建更好的 Agent-Native Models”的指数级改进战略循环。
- 主权 AI 与去中心化:通过降低对超大规模算力的依赖,使非顶级科技巨头(如日本等国家机构)也能参与前沿 AI 研发,推动 AI 技术的民主化和主权化。
- 实战成果验证:团队已在 LLM 自动优化、代码生成、科学发现(Nature 发表)、对抗性进化等多个领域取得了经过同行评审或基准测试验证的实质性突破。
意义与影响
Sakana AI 成立 RSI Lab 并公开其技术路线图,具有深远的行业和社会意义:
- 挑战“算力即正义”的行业共识:目前前沿 RSI 研究几乎完全集中在全球两个最大的算力集群内部。Sakana AI 提出在东京建立实验室,证明了在算力受限环境下,通过算法创新和样本效率优化同样可以实现智能的指数级增长。这为其他资源有限的国家或机构提供了可行的技术路径。
- 重新定义 AI 研发模式:从“人类主导的静态研发”转向“自主的、自我改进的智能引擎”。这意味着未来的 AI 系统将不再仅仅是工具,而是能够自主发现漏洞、优化代码、甚至进行科学研究的“研究人员”。
- 推动 AI 技术的普惠化(Democratization):如果递归自我改进可以在适度算力上实现,那么 AI 的前沿能力将不再被少数拥有超大规模集群的科技巨头垄断。这将改变全球 AI 竞争的地理格局,使更多国家和机构能够构建解决本地特定问题的 AI 系统。
- 确立“进化式 AI”的标准:通过展示 LLM-Squared、DGM、ShinkaEvolve 等一系列具体成果,Sakana AI 正在为“进化式优化循环”建立事实标准。其强调的“从失败中学习”
