AI世界正变得“循环往复”
速览
AI领域正呈现出一种“循环”(loopy)的新趋势。这种循环机制将代理式AI(agentic AI)推向了新的高度,它授权一群智能体在后台持续不断地工作。这种无限循环的模式有望显著提升AI系统的自主性和长期任务处理能力。
AI 深度解读
AI 世界正变得“循环往复”:Agent 循环为何成为下一个风口?
背景
在近期 Meta 举办的 @Scale 大会上,Claude Code 的创始人 Boris Cherny 的演讲引发了一场意想不到的讨论。当被问及“循环(Loops)”是否是下一个炒作周期,还是切实可用的技术时,Cherny 给出了肯定的回答。
这一观点的出现并非偶然。随着 AI 从简单的文本生成向自主代理(Agentic AI)演进,开发者们正在经历工作流的根本性转变:从手动编写源代码,到让 AI 代理编写代码,再到如今让 AI 代理去提示其他 AI 代理以生成代码。Cherny 认为,尽管从源代码到 AI 代理的转变巨大,但“循环”带来的变革同样重要。
核心内容
Boris Cherny 在演讲中详细阐述了他个人工作流中正在运行的“循环”机制。他描述了两个具体的 AI 代理实例:一个代理持续寻找改进代码架构的方法,另一个代理则致力于发现可以统一的重复抽象概念。这些代理像人类程序员一样提交 Pull Requests(代码合并请求)。由于代码库在不断变化,这些代理的工作永不停止。
这种模式标志着 AI 使用范式的重大转移。过去,用户管理 AI 代理的重点在于设定清晰的目标、检查阶段性进展,并防止代理偏离提示词的范围。而“循环”模式则更进一步,它授权一群代理在后台持续、无限地工作。这需要用户对 AI 建立极高的信任,但随着模型能力的快速提升,这可能是让 AI 处理实际复杂工作的下一步。
从技术演进的角度看,递归循环并非全新概念。在计算机科学基础课程中,递归函数(即调用自身以重复执行某动作,并带有停止条件的函数)是核心内容。然而,AI 时代的循环遵循的是非确定性逻辑:停止循环的决策由子代理根据上下文判断,而非预设的明确条件。一旦程序员开始利用 AI 完成任务,AI 监督 AI 的递归循环模式便应运而生。
与经典计算不同,Agent 循环的实现可以异常简单。目前最流行的技巧之一是“Ralph Loop”(以《辛普森一家》中的角色 Ralph Wiggum 命名)。其核心逻辑是将模型已完成的所有工作汇总,并询问其是否已达成目标。这种方法旨在解决 AI 模型在长时间运行中迷失方向的问题,通过不断将模型“弹回”初始状态或重新评估进度,直到任务完成。
此外,循环机制也是更广泛“测试时计算(Test-time Compute)”趋势的一部分。OpenAI 研究员 Noam Brown 指出,如果投入足够的计算资源,当代模型几乎能解决任何问题。因此,确保问题解决的一种策略就是持续投入计算资源,直到任务结束。这在“爬山式”问题(如改进代码库)中尤为有效,模型可以不断进行增量改进,直到达到既定阈值,或者只要有计算资源可用,就持续进行改进。
然而,这种模式伴随着高昂的成本。与简单的问答聊天机器人相比,AI 循环消耗 Token 的速度极快。由于循环旨在全天候运行,其成本上限难以预测。对于 Anthropic 等以出售 Token 为主要业务的公司而言,这或许是常态;但对于其他用户来说,这可能是一种昂贵的协作方式。尽管如此,如果配置得当,能够监控 Token 消耗、漂移(Drift)等经典 AI 问题,循环带来的收益可能足以抵消其成本。
关键要点
- 范式转移:AI 开发正从“人写代码”转向“代理写代码”,进而发展为“代理提示代理”的循环模式。
- 持续自治:Cherny 展示了 AI 代理如何像人类开发者一样持续运行,不断提交代码改进和重构建议,且工作流永不中断。
- 非确定性逻辑:与传统编程中基于明确条件的递归不同,AI 循环依赖子代理判断何时停止,具有非确定性特征。
- 简单有效的策略:“Ralph Loop”等简单技巧通过汇总工作成果并重新评估目标,有效解决了长任务中模型迷失方向的问题。
- 测试时计算(Test-time Compute):循环机制本质上是增加测试时的计算投入,通过“暴力”投入算力来解决复杂问题(如代码优化)。
- 成本挑战:AI 循环消耗 Token 的速度远超传统交互,且由于持续运行,成本可能无上限,这对非 Token 销售型公司构成挑战。
- 潜在收益:尽管成本高,但在正确设置监控机制(防止漂移、控制成本)的前提下,循环模式带来的生产力提升可能极具价值。
意义与影响
“循环”概念的兴起标志着 AI 应用从“单次交互”向“持续自治”的深化。它不再仅仅是一个工具,而是一个能够自我迭代、自我修正的工作流引擎。
对于开发者而言,这意味着工作重心将从“编写提示词”转向“设计循环架构”和“设定评估标准”。我们需要思考如何定义“完成”,如何监控代理的“漂移”,以及如何平衡计算成本与产出质量。
对于行业而言,这推动了“测试时计算”成为新的竞争维度。谁能更高效地管理长周期的 Agent 循环,谁就能在复杂任务(如软件工程、科学发现)中占据优势。然而,这也带来了新的伦理和安全考量:当 AI 代理在后台无休止地运行并自主决策时,如何确保其行为始终符合人类意图,将是未来技术治理的核心难题。
最终,AI 世界变得“Loopy”(循环/怪诞),既反映了技术的复杂性,也揭示了人类试图通过自动化实现无限进化的野心。
