如今的PR垃圾邮件宛如2000年代初的垃圾邮件
速览
文章将当前泛滥的PR垃圾邮件与2000年代初的垃圾邮件进行对比,指出两者在形式和危害上高度相似。这种类比揭示了当前公关传播中存在的低质量、高噪音问题。作者通过这一历史对照,呼吁业界反思并改善当前的PR生态。
AI 深度解读
PR 垃圾邮件:开源贡献的“2000年代电子邮件”时刻
背景
Rahul 在 Greptile 工作,该公司致力于构建用于审查代码拉取请求(Pull Requests, PRs)的 AI 代理。Greptile 为 OpenClaw 提供 PR 审查服务,而 OpenClaw 在 GitHub 上几乎是一夜之间成为了增长最快的仓库。这一现象让作者得以近距离观察开源社区中正在发生的一种奇怪变化。
去年 12 月,OpenClaw 每周仅收到两个 PR。到了 2 月,这一数字飙升至每周 3,400 个。在激增之前,约 48% 的 PR 被合并;激增之后,这一比例降至不到 9.3%。
许多新增的 PR 是由人们使用的 AI 编码代理生成的低质量“垃圾”代码。例如,有一位贡献者在一天内提交了 106 个 PR,提交间隔的中位数仅为 3 秒。OpenClaw 的案例为我们预览了未来开源贡献可能呈现的形态。
核心内容
作者通过 OpenClaw 的数据观察,提出了三个关于开源贡献未来趋势的关键观察:
1. PR 将需要发送者声誉(Reputation)
当前的 PR 垃圾邮件现象,类似于 2000 年代初的电子邮件垃圾邮件。
当作者首次查看 OpenClaw 的数据时,这种模式让他想起了电子邮件。2000 年,ILOVEYOU 蠕虫病毒在 24 小时内感染了 4500 万台计算机,因为发送电子邮件的成本趋近于零,且人们信任该平台。结果是邮件量激增,其中包含恶意内容。如今,PR 面临相同的参数:发送成本低,且存在滥用风险。
早期的应对措施是相似的:使用黑名单管理数量,并利用基于置信度的过滤器和声誉基础设施来识别不良行为者。如今,你的邮件能否进入收件箱,主要取决于两点:你是谁,以及你的发送历史。
在 OpenClaw 上,贡献者已经根据其声誉受到过滤:
- 新手的合并率为 8.2%;
- 拥有 2-5 个 PR 的贡献者合并率为 10.3%;
- 拥有 5 个以上 PR 的贡献者合并率为 18.6%。
另一个典型案例是 Mitchell Hashimoto 维护的 Ghostty(一款流行的开源终端模拟器)。随着项目热度上升,大量 AI 生成的低质量 PR 涌入,迫使 Mitchell 限制 AI 生成的贡献。一周后,他发布了解决方案:Vouch,一个用于开源贡献者的信任管理系统。未经 Vouch 验证的用户无法贡献,不良行为者会被明确标记。虽然 Vouch 目前仅针对特定项目,但 Mitchell 的愿景是,信任决策最终能在价值观相似的项目间产生涟漪效应。Vouch 本质上等同于开源领域的“发送者声誉评分”。
值得注意的是,尽管 Vouch 在 Ghostty 上运作良好,Mitchell 随后决定将 Ghostty 从 GitHub 撤下。
2. 如果所有人思维方式相同,更多的贡献者并不会带来帮助
Linus Torvalds 有一句名言:“只要有足够多的眼睛,所有 bug 都是浅显的。”
更多的眼睛意味着更多的视角。不同的人以不同的方式使用软件,遇到不同的 bug,并以新颖的方式解决问题。然而,当所有人都在使用相同的 AI 编码代理(如 Claude、Codex、Cursor、Devin 等)时,这一法则可能不再成立。
在 OpenClaw 中出现了以下现象:
- 4 名贡献者提交了标题完全相同的 PR:“feat(web-search): add SearXNG as a search provider”。他们是 10 多名独立尝试添加同一功能的贡献者中的 4 人。
- 6 人独立修复了同一个 Brave Search 的区域设置 bug,其中 2 人在相隔 94 分钟时提交了标题完全相同的 PR。
- 5 人独立发现了代理运行器中的同一个超时死锁问题。
虽然 OpenClaw 拥有的“眼睛”比以往任何时候都多,但这些视角正被 AI 编码代理过滤。如果大多数贡献者使用相同的 AI 代理和相同的提示词(Prompts),他们的贡献也会变得雷同。
开源的承诺和优势在于思维的多样性。Linus 定律成立的前提是底层思维保持多样。真正深入研究代码库的贡献者,其提示词会与不深入研究的人截然不同。
3. 实际被合并的是什么?
在 OpenClaw 的 PR 数据中,新功能(Features)的合并率为 9%,而重构(Refactors)的合并率为 35%。
需要深入理解现有代码库的贡献,其表现优于新颖的功能贡献,高出近 4 倍。这印证了当下的普遍观点:思考比打字更重要,数据也支持了这一结论。
例如,claude-mem 将 Claude Code 的钩子捕获工具流映射到其自身的可恢复 Agent SDK 观察者会话中,这是一种非显而易见的架构选择,需要对两个系统都有深入的理解。一位理解这一决策的软件开发者可以将其提炼为一个检查清单,这将转化为提示词,从而显著提高 AI 代理的输出质量。如果仅仅提示代理“构建一个记忆系统”,代理是无法独自实现这一点的。
直到 200 年前,建筑设计者同时也是建造者,他们被称为“大师建筑师”。随着建筑技术的发展,这一角色分裂为两个工种:建筑设计和施工。软件领域的类比并不完全完美,建筑师仍需了解建筑如何支撑。但这指向了一个现实:能够通过审查的贡献,越来越依赖于 AI 无法独立完成的部分——即需要对现有系统进行深入理解的调用,而非全新的构建。
未来展望
OpenClaw 在短短几个月内从无名小卒变成了现实世界中的 Jarvis。一个人加上一个强大的社区,以一年前不可能实现的速度构建了该项目,这非常特殊。
开源社区可以比以往任何时候都构建得更快。由此产生的问题需要更好的身份、声誉以及贡献验证的原语(Primitives),而这些都将随之建立。开源社区以前解决过更困难的问题。
关键要点
- PR 垃圾邮件泛滥:AI 编码代理导致低质量 PR 激增(如 OpenClaw 每周从 2 个增至 3,400 个),合并率大幅下降(从 48% 降至 9.3%)。
- 声誉机制成为刚需:如同早期的电子邮件反垃圾策略,开源社区开始依赖发送者声誉和信任系统(如 Ghostty 的 Vouch)来过滤不良贡献。
- 思维同质化风险:当大量贡献者使用相同的 AI 工具(Claude, Codex, Cursor 等)和提示词时,会导致重复劳动和视角单一,削弱“众人拾柴火焰高”的优势。
- 深度理解优于代码生成:需要深入理解现有架构的重构和集成工作(合并率 35%)远优于简单的功能新增(合并率 9%)。AI 擅长生成代码,但难以替代对系统整体架构的深刻洞察。
- 开源生态的自我进化:面对速度带来的挑战,开源社区正在构建新的基础设施(身份、声誉、验证机制),以维持其高效和高质量的发展。
意义与影响
这篇文章揭示了 AI 时代开源软件(OSS)开发范式的深刻转变。随着 AI 编码代理的普及,代码生产的边际成本急剧降低,这既带来了效率的提升,也引发了“垃圾信息”过载和思维同质化的危机。
- 从“量”到“质”的审查机制转型:开源维护者不能再仅仅依靠“足够多的眼睛”来发现 bug,因为“眼睛”可能来自同一个 AI 模型。社区必须建立更精细的声誉系统和信任验证机制,以区分高质量的人类洞察和自动化的代码噪音。
- 人类贡献者的角色重塑:人类开发者将从“代码打字员”转变为“系统架构师”和“提示词工程师”。核心价值在于对现有系统的深刻理解、架构决策以及将复杂逻辑转化为 AI 可执行指令的能力。
- 开源治理的基础设施升级:正如电子邮件发展出了 SPF、DKIM 等声誉协议,开源社区也需要类似的信任基础设施。像 Vouch 这样的工具可能会成为标准,解决跨项目的身份验证和贡献者信誉问题。
- 多样性价值的再确认:在 AI 试图标准化解决方案的背景下,保持人类思维的多样性
