AI 资讯Hacker News·3 小时前

AI编码新招数：短链条法破解Fable游戏

原标题：The Short Leash AI Coding Method for Beating Fable

速览

最近，AI开发者提出了一种名为“短链条”的AI编码方法，该方法通过限制上下文长度来提高代码生成的准确性和速度。实验显示，这种方法在破解《Fable》游戏等复杂任务中表现优异，超越传统长链条编码方式。研究者认为，这为AI在游戏开发和复杂系统编程中提供了新思路，有望推动AI编码工具的普及。

AI 深度解读

## 背景

这篇帖子来自 Hacker News，作者以资深软件开发者、协议开发者以及安全关键软件维护者的身份撰写，总结了超过一年深入研究 AI 代理的经验。作者指出，AI 代理在软件开发中存在局限性，曾亲自创建自家 AI 代码审查工具，并维护了名为 Crush 的 AI 编码代理自定义分支。通过这篇帖子，作者希望为追求高品质软件开发的专家开发者提供实用方法，强调必须使用专业技能来管理 AI，而非依赖“氛围式”工程。

## 核心内容

作者首先指出，当前 AI 代理使用方法存在明显缺陷：开发者会发现初始想法过于愚蠢，存在更好的替代方案；或者代理“脱轨”，开始执行与开发者意图完全不同的操作。作者曾观看数百万观看量的 YouTube 视频，了解那些宣称使用 12 个并行代理 + 协调器实现“完全不参与编码过程”的“氛围式”工程，开发者只需在海滩上、洗手间或喝咖啡时监督 slop 的编写与审查。这种方法无法让开发者真正理解代码库，一旦代理多次脱轨，问题会在实际使用软件时才显现，特别在对质量有要求的场景中无法接受。

即使最先进的模型（如 Fable 5）生成的代码也存在问题：代码能运行，但效率极低且丑陋。这种低效问题在缺乏大量训练数据的 niche 领域尤为严重。作者明确表示，模型无法超越其训练数据，营销宣传无法改变这一事实。

在此基础上，作者提出“Short Leash”（短牵引）方法，仅限专业软件开发者使用，可实现超越前沿模型的结果。在该方法中：

必须先进行规划阶段，研究任务、制定计划，并使用作者开发的 tasks skill 来跟踪进度、将大型任务拆分成步骤（与“氛围式”工程有共同点，但在此后点完全不同）。
严禁使用“YOLO”模式（即危险地跳过权限检查）。
AI 绝不能在开发者玩游戏时工作。
编码代理必须通过权限提示展示即将进行的更改 diff。
开发者必须像 20 世纪末的狂热分子一样，亲自逐行分析代理提出的更改。
始终保持在环路内，而非像 YouTube 博主那样完全移除自己。
将权限提示中的 diff 作为工具，维持对代码库的实时理解，并让 AI 始终处于“短牵引”状态。
只要看到 AI 即将执行不希望的操作，即立即 DENY 权限。
频繁干预，防止 AI“脱轨”。
始终将 AI 保持在短牵引范围内。
每个子任务结束时必须提交一次 commit，以防 AI 出现错误导致删除之前的工作（作者曾亲眼见过 Opus 出现此问题）。
最后进行审查。

关于 AI 审查环节，作者强调：仅由人类或仅由 AI 审查的 PR，其错误数量远多于同时由人类和 AI 审查的 PR。AI 可作为 linter，快速发现常见错误；人类则能发现高层级问题和方向性调整。

审查流程建议：

对每个 PR 必须使用 AI 审查。
AI 必须具备充分上下文（issue、PR 描述、代码库及更改）。
使用最新最强大的模型进行审查。
PR 描述必须在 “AI Disclosure” 标题下披露使用的精确模型（若有），服务于多个目的：告知维护者已使用 AI、让他们建议更好模型、证明开发者是“好人”而非偷偷使用 AI。
更重要的是，如果 PR 使用了 AI，PR 作者必须亲自审查。
AI 辅助的 PR 本质上是 AI 写的代码 + 人类协助的 PR，因此提交者必须完全理解所提交的内容，否则无法信任。若未审查，提交者无法承担责任，必须像审查他人 PR 一样逐行审查自己的 PR，完成后确认批准并请求维护者关注。这能构建并展示对代码库的理解。

作者最后表示，这些实践已在 okTurtles 团队中应用，并附带官方 AI 使用政策。帖子以“Fin”结尾，AI 披露明确表示本帖完全由人类完成，最终 AI 风格拼写检查后发布。

## 关键要点

AI 代理若采用“氛围式”工程（完全移除开发者），无法构建对代码库的真正理解，问题易在运行时显现，不适用于质量要求高的场景。
即使 Fable 5 等前沿模型生成的代码也常效率低、丑陋，尤其在 niche 领域训练数据不足时。
“Short Leash” 方法仅限专业开发者使用，通过规划、权限展示 diff、实时分析、频繁干预、每次子任务提交 commit 及审查，可有效控制 AI，避免脱轨并实现优于前沿模型的成果。
AI 审查不可或缺，必须结合人类高层级判断；AI 仅作为 linter 快速发现常见问题。
每个使用 AI 的 PR 描述需在 “AI Disclosure” 下精确披露模型；若使用 AI，PR 作者必须亲自审查并确认理解，才能提交。
所有 AI 活动必须始终保持“短牵引”：实时 diff 检查、即时 DENY 权限、避免 YOLO 模式，并依赖 commit 保护历史工作。

## 意义与影响

该方法为安全关键软件开发提供了可操作的 AI 使用框架，通过“短牵引”策略确保开发者始终掌控 AI 行为，避免 slop 污染和脱轨风险，同时利用人类专业判断弥补模型局限。即使非前沿模型，也能实现超越“氛围式”工程的高品质输出。实践者可直接应用规划、权限控制、diff 分析及审查流程，显著提升软件开发效率而不牺牲质量。作者强调，此方案针对少数已达专家水平的开发者，拒绝为“hate AI”的开发者提供建议，体现对 AI 作为工具而非威胁的理性定位。整体框架推动行业向 AI 辅助开发演进，同时保留人类在安全与质量上的最终责任，助力开发者在安全关键系统上实现可持续、可验证的进步。

查看原文 →blog.okturtles.org

AI编码新招数：短链条法破解Fable游戏

速览

AI 深度解读

相关推荐