← 返回信息流
AI 资讯Hacker News·3 小时前

AI编码新招数:短链条法破解Fable游戏

原标题:The Short Leash AI Coding Method for Beating Fable

速览

最近,AI开发者提出了一种名为“短链条”的AI编码方法,该方法通过限制上下文长度来提高代码生成的准确性和速度。实验显示,这种方法在破解《Fable》游戏等复杂任务中表现优异,超越传统长链条编码方式。研究者认为,这为AI在游戏开发和复杂系统编程中提供了新思路,有望推动AI编码工具的普及。

AI 深度解读

## 背景

这篇帖子来自 Hacker News,作者以资深软件开发者、协议开发者以及安全关键软件维护者的身份撰写,总结了超过一年深入研究 AI 代理的经验。作者指出,AI 代理在软件开发中存在局限性,曾亲自创建自家 AI 代码审查工具,并维护了名为 Crush 的 AI 编码代理自定义分支。通过这篇帖子,作者希望为追求高品质软件开发的专家开发者提供实用方法,强调必须使用专业技能来管理 AI,而非依赖“氛围式”工程。

## 核心内容

作者首先指出,当前 AI 代理使用方法存在明显缺陷:开发者会发现初始想法过于愚蠢,存在更好的替代方案;或者代理“脱轨”,开始执行与开发者意图完全不同的操作。作者曾观看数百万观看量的 YouTube 视频,了解那些宣称使用 12 个并行代理 + 协调器实现“完全不参与编码过程”的“氛围式”工程,开发者只需在海滩上、洗手间或喝咖啡时监督 slop 的编写与审查。这种方法无法让开发者真正理解代码库,一旦代理多次脱轨,问题会在实际使用软件时才显现,特别在对质量有要求的场景中无法接受。

即使最先进的模型(如 Fable 5)生成的代码也存在问题:代码能运行,但效率极低且丑陋。这种低效问题在缺乏大量训练数据的 niche 领域尤为严重。作者明确表示,模型无法超越其训练数据,营销宣传无法改变这一事实。

在此基础上,作者提出“Short Leash”(短牵引)方法,仅限专业软件开发者使用,可实现超越前沿模型的结果。在该方法中:

  • 必须先进行规划阶段,研究任务、制定计划,并使用作者开发的 tasks skill 来跟踪进度、将大型任务拆分成步骤(与“氛围式”工程有共同点,但在此后点完全不同)。
  • 严禁使用“YOLO”模式(即危险地跳过权限检查)。
  • AI 绝不能在开发者玩游戏时工作。
  • 编码代理必须通过权限提示展示即将进行的更改 diff。
  • 开发者必须像 20 世纪末的狂热分子一样,亲自逐行分析代理提出的更改。
  • 始终保持在环路内,而非像 YouTube 博主那样完全移除自己。
  • 将权限提示中的 diff 作为工具,维持对代码库的实时理解,并让 AI 始终处于“短牵引”状态。
  • 只要看到 AI 即将执行不希望的操作,即立即 DENY 权限。
  • 频繁干预,防止 AI“脱轨”。
  • 始终将 AI 保持在短牵引范围内。
  • 每个子任务结束时必须提交一次 commit,以防 AI 出现错误导致删除之前的工作(作者曾亲眼见过 Opus 出现此问题)。
  • 最后进行审查。

关于 AI 审查环节,作者强调:仅由人类或仅由 AI 审查的 PR,其错误数量远多于同时由人类和 AI 审查的 PR。AI 可作为 linter,快速发现常见错误;人类则能发现高层级问题和方向性调整。

审查流程建议:

  • 对每个 PR 必须使用 AI 审查。
  • AI 必须具备充分上下文(issue、PR 描述、代码库及更改)。
  • 使用最新最强大的模型进行审查。
  • PR 描述必须在 “AI Disclosure” 标题下披露使用的精确模型(若有),服务于多个目的:告知维护者已使用 AI、让他们建议更好模型、证明开发者是“好人”而非偷偷使用 AI。
  • 更重要的是,如果 PR 使用了 AI,PR 作者必须亲自审查。
  • AI 辅助的 PR 本质上是 AI 写的代码 + 人类协助的 PR,因此提交者必须完全理解所提交的内容,否则无法信任。若未审查,提交者无法承担责任,必须像审查他人 PR 一样逐行审查自己的 PR,完成后确认批准并请求维护者关注。这能构建并展示对代码库的理解。

作者最后表示,这些实践已在 okTurtles 团队中应用,并附带官方 AI 使用政策。帖子以“Fin”结尾,AI 披露明确表示本帖完全由人类完成,最终 AI 风格拼写检查后发布。

## 关键要点

  • AI 代理若采用“氛围式”工程(完全移除开发者),无法构建对代码库的真正理解,问题易在运行时显现,不适用于质量要求高的场景。
  • 即使 Fable 5 等前沿模型生成的代码也常效率低、丑陋,尤其在 niche 领域训练数据不足时。
  • “Short Leash” 方法仅限专业开发者使用,通过规划、权限展示 diff、实时分析、频繁干预、每次子任务提交 commit 及审查,可有效控制 AI,避免脱轨并实现优于前沿模型的成果。
  • AI 审查不可或缺,必须结合人类高层级判断;AI 仅作为 linter 快速发现常见问题。
  • 每个使用 AI 的 PR 描述需在 “AI Disclosure” 下精确披露模型;若使用 AI,PR 作者必须亲自审查并确认理解,才能提交。
  • 所有 AI 活动必须始终保持“短牵引”:实时 diff 检查、即时 DENY 权限、避免 YOLO 模式,并依赖 commit 保护历史工作。

## 意义与影响

该方法为安全关键软件开发提供了可操作的 AI 使用框架,通过“短牵引”策略确保开发者始终掌控 AI 行为,避免 slop 污染和脱轨风险,同时利用人类专业判断弥补模型局限。即使非前沿模型,也能实现超越“氛围式”工程的高品质输出。实践者可直接应用规划、权限控制、diff 分析及审查流程,显著提升软件开发效率而不牺牲质量。作者强调,此方案针对少数已达专家水平的开发者,拒绝为“hate AI”的开发者提供建议,体现对 AI 作为工具而非威胁的理性定位。整体框架推动行业向 AI 辅助开发演进,同时保留人类在安全与质量上的最终责任,助力开发者在安全关键系统上实现可持续、可验证的进步。

查看原文 →blog.okturtles.org