AI 资讯TechCrunch AI·5 天前

拒绝使用AI的程序员可能自食其果

原标题：Coders are refusing to work without AI — and that could come back to bite them

速览

研究人员指出，虽然人工智能帮助程序员更快地生成代码，但这并不意味着代码质量得到了提升。这种对 AI 的过度依赖可能导致代码存在潜在缺陷或维护困难。长远来看，这种趋势可能会给开发者自身带来严重的职业风险和技术问题。

AI 深度解读

程序员拒绝脱离 AI 工作，但这可能成为他们的“阿喀琉斯之踵”

背景

2026 年，AI 编程工具已经深度嵌入开发者的工作流中，甚至形成了某种“刚性依赖”。近期，AI 研究机构 METR 试图重复 2025 年关于 AI 编程生产力的开创性研究，却遭遇了一个意想不到的障碍：绝大多数开发者拒绝参与不需要使用 AI 的实验任务。

这一现象揭示了一个严峻的现实：虽然 AI 显著提升了代码生成的速度，但其对代码质量、长期维护成本以及企业实际产出的影响仍存巨大争议。与此同时，行业内出现的“Tokenmaxxing”（以 Token 消耗量作为生产力指标）趋势及其带来的高昂成本，正在让企业和开发者重新审视 AI 的真实价值。

核心内容

1. METR 研究的困境与发现

2026 年 2 月，备受尊敬的 AI 研究机构 METR 发表了一项令人惊讶的调查结果：大多数开发者已无法在没有 AI 辅助的情况下工作，即使是仅涉及少量任务的有限实验也不例外。

METR 原本希望更新 2025 年发布的一项关于 AI 编程生产力的研究。在那项早期研究中，研究人员对比了开源开发者手动完成任务与使用 AI 完成任务所需的时间。虽然开发者自述 AI 提高了他们的生产力，但数据却显示相反的结果：尽管 AI 生成代码的速度更快，但开发者花费了大量额外时间去查找错误、修复 Bug、引导 AI 以及等待任务完成，最终导致整体效率反而下降。

当 METR 试图在 2026 年重复该实验以衡量 AI 进步和程序员熟练度的变化时，他们发现实验无法进行。研究人员坦言，开发者不愿参与，因为他们“不希望在不使用 AI 的情况下工作”，哪怕只是为了参与研究。

2. 自我感知的偏差与“Tokenmaxxing”泡沫

由于无法进行受控实验，METR 于 2026 年 5 月发布了一份调查，允许技术员工自我报告 AI 带来的生产力提升。不出所料，受访者普遍认为 AI 使他们为组织创造的价值翻了一番。

然而，这种自我感知正受到近期数据和新闻的挑战。2026 年初，“Tokenmaxxing”成为行业趋势，即企业和个人将 AI 使用的 Token 数量作为生产力的代理指标。但这股热潮可能已经走向反面：

Amazon 的案例：据《金融时报》报道，Amazon 关闭了其内部名为 Kirorank 的 Token 追踪排行榜。原因是员工通过过度使用 AI 代理来刷高数据，导致成本飙升。这证明 AI 的使用并不自动转化为生产力的提升。
Uber 的案例：据 The Information 报道，Uber 在 2026 年的前四个月内就耗尽了全年的 AI 预算。其首席运营官 Andrew Macdonald 最近在播客中表示，这种支出并未带来项目数量或生产力的可测量增长。

3. 代码维护成本的隐形陷阱

AI 生成的代码并不一定减少，甚至可能增加长期的代码维护需求。程序员兼作家 James Shore 在 Hacker News 上引发热议的博客文章中精辟地指出：“如果你现在写代码的速度快了一倍，最好希望你的维护成本减半。否则，你就完了。你是在用暂时的速度提升换取永久的奴役。”

其他证据也支持这一观点：

Entelligence AI 创始人兼 CEO Aiswarya Sankar 在推特上指出，公司花费了 44% 的 Token 用于修复由 AI 生成的 Bug。
代码审查工具公司 Code Rabbit 分析开源 Pull Requests 后发现，AI 产生的问题数量是人工代码的 1.7 倍。

尽管上述数据来自试图销售 AI 代码审查工具的公司，可能存在自利嫌疑，但独立研究也证实了类似问题。2026 年 4 月，新加坡管理大学（SMU）的研究人员发布报告警告称：“AI 生成的代码可能会给现实软件项目引入长期的维护成本。”

4. 解决方案：人机协作的新范式

面对程序员对 AI 助手的依赖以及随之而来的维护难题，业界提出了不同的解决思路：

AI 代理修复论：以 Cognition 创始人兼 CEO Scott Wu（AI 编程代理 Devin 的创造者）为代表的支持者认为，开发者可以使用 AI 编程代理来快速修复代码，速度应与 AI 生成代码的速度相匹配。然而，Wu 也承认，尽管 Devin 可以独立工作，但其技能水平仅相当于初级到中级程序员，具体取决于任务类型。因此，这并非一个可以“甩手不管”的解决方案。
人类主导的质量控制：SMU 研究人员提出了更具人文色彩的建议。程序员应像熟悉自己最爱的编程语言一样，深入理解 AI 擅长和不擅长的任务。企业需要建立专为 AI 设计的质量保证系统，并像审查初级开发人员的工作一样，仔细审查 AI 的输出。
人类的核心价值：研究人员和 Wu 均同意，人类仍应专注于宏观层面的工作，如软件架构和安全设计。

关键要点

依赖性固化：到 2026 年，大多数开发者已无法脱离 AI 工作，甚至拒绝参与无 AI 的实验，显示出对 AI 工具的刚性依赖。
生产力悖论：虽然 AI 加快了代码生成速度，但额外的调试、引导和等待时间可能导致整体效率下降，早期研究已证实这一点。
Token 指标失效：“Tokenmaxxing”作为生产力指标已被证明是误导性的。Amazon 和 Uber 的案例显示，高 Token 消耗并未带来相应的生产力提升，反而造成了巨大的预算浪费。
维护成本激增：AI 生成的代码可能引入更多 Bug 和长期维护负担。数据显示，大量 Token 被用于修复 AI 自身产生的错误，且 AI 代码的问题密度高于人工代码。
角色重新定位：AI 目前相当于初级到中级程序员，无法完全替代人类。开发者需转变为“审查者”和“架构师”，建立针对 AI 代码的质量保证流程，并专注于软件架构和安全设计等高价值工作。

意义与影响

这一趋势标志着 AI 在软件开发领域的应用正从“盲目追求速度”转向“理性评估价值”。对于企业和开发者而言，单纯堆砌 AI 使用量已不再是提升竞争力的有效手段。

对企业而言，必须重新评估 AI 投资的 ROI（投资回报率）。停止将 Token 消耗量作为 KPI，转而关注代码质量、维护成本和实际交付价值。建立严格的 AI 代码审查机制和质量保证体系，是避免陷入“技术债”陷阱的关键。

对开发者而言，核心竞争力正在发生转移。单纯的编码速度优势正在被 AI 抹平，未来的价值在于对 AI 输出的批判性审查、系统架构设计以及解决复杂问题的能力。开发者需要像管理初级员工一样管理 AI 代理，既要利用其效率，又要承担最终的质量责任。

对行业而言，AI 编程工具的市场将经历洗牌。那些仅能提供代码生成而缺乏质量保障、安全审计和架构辅助能力的工具将面临淘汰。能够集成高质量审查、自动化测试和架构建议的综合型 AI 开发平台将成为主流。

总之，AI 并未让程序员“失业”，但正在重塑他们的职责。拒绝 AI 已不可能，但盲目依赖 AI 同样危险。未来的成功属于那些能够驾驭 AI 而非被 AI 驾驭的团队。

查看原文 →techcrunch.com