AI 资讯Hacker News·1 小时前

Tokenmaxxing已死，Tokenmaxxing万岁

原标题：Tokenmaxxing is dead, long live Tokenmaxxing

速览

本文标题以悖论形式提出，暗示Tokenmaxxing作为一种策略或现象正在经历重大转变。作者意在探讨该概念在AI发展中的新定义或新形态，而非简单的消亡。这反映了AI领域对效率、成本或模型优化策略的持续反思与重构。

AI 深度解读

Tokenmaxxing 已死？长存 Tokenmaxxing

背景

在人工智能（AI）迅速渗透企业环境的当下，一个名为“Tokenmaxxing”的现象引发了广泛讨论。这一术语指的是企业高管无意中鼓励员工为了提升绩效指标，而毫无意义地消耗大量 AI 令牌（tokens，即 AI 模型处理文本的基本单位，通常与成本挂钩）。

最典型的案例来自 Meta。据报道，Meta 曾将员工的绩效评估与人均令牌使用量挂钩。这种激励机制导致了荒诞的结果：有员工反映，他们甚至会让两个 AI 代理（Agents）整天互相对话，仅仅为了刷高令牌消耗数据。外界普遍批评这种政策是高管的愚蠢之举，认为他们为了花钱而花钱，却未期望任何投资回报。

然而，随着 AI 工具从“可选”变为“必选”，以及底层模型能力的跃升，这种看似非理性的行为背后，可能隐藏着更深层的战略逻辑。本文旨在重新审视这一现象，探讨其从“强制推广”到“能力质变”的演变过程。

核心内容

1. 表象：看似愚蠢的“烧钱”激励

通常情况下，企业领导者不会像赌徒在《原神》中抽卡那样，为了“感觉良好”而随意挥霍资金。对于像 Meta 这样的巨头，将令牌使用量作为 KPI 看似是一种管理失误，导致了资源的极大浪费。公众和业界的普遍看法是：高管们因为缺乏远见，错误地激励员工进行无意义的令牌消耗。

2. 反转：一种“钝器”式的变革策略

作者提出了一个反直觉的观点：这并非意外，而是高管们故意采取的一种策略。

几个月前，许多资深员工对 AI 工具持强烈抵触态度，甚至在尝试使用时产生糟糕的结果。为了打破这种组织内部的阻力，高管们需要一种“钝器”（blunt force）来强行突破。通过设定高令牌消耗的目标，强制性地让全员上手 AI 工具。

这一策略取得了预期效果：

普及率提升：现在，几乎所有团队都在使用 AI 进行编码，至少在使用 Cursor 等工具的侧边栏功能。
成本激增：随着使用量的普及，令牌支出大幅上升。

3. 转折：补贴消退与“Tokenmaxxing”的终结？

随着 OpenAI 和 Anthropic 等公司寻求上市，其商业策略发生变化：

API 定价上涨：订阅服务的额度被限制，API 价格提高。
补贴消失：之前的“令牌补贴”逐渐减少。

由于激励措施消失且成本飙升，团队开始取消无限制的令牌支出政策。表面上看，“Tokenmaxxing”作为一种基于错误激励的现象已经死亡。

4. 新生：从“复合错误”到“复合正确”

然而，作者认为“Tokenmaxxing”的精神内核将以一种更强大的形式重生，其基础是 AI 模型能力的根本性转变。

过去：复合错误（Compounding Error） 以前，AI 无法长时间无人值守运行。模型产生的微小错误（包括幻觉）会随着时间累积，最终导致项目彻底失败。因此，人类必须密切监督，且长时间运行代理（Agents）并无益处，因为投入更多令牌只会产生更糟糕的结果。
现在：复合正确（Compounding Correctness） 我们进入了一个新的范式：投入更多令牌通常能带来更好的结果。通过增加计算资源（令牌），模型更有可能纠正自身错误，从而达成更准确的任务结果。这意味着，为了获得高质量输出，企业愿意并需要花费更多令牌。这种“花钱买质量”的逻辑，听起来与之前的“Tokenmaxxing”惊人地相似，但这次是理性的、基于能力的。

5. 案例佐证：网络安全与“循环”机制

网络安全中的“算力军备竞赛” Anthropic 发布的内部模型 Mythos 展示了这一趋势。该模型在计算机安全任务上表现卓越，AISI（美国人工智能安全研究所）为其分配了 1 亿令牌的预算用于漏洞挖掘。结果显示，模型在预算范围内并未出现收益递减迹象。这形成了一种新的安全经济学：为了加固系统，防御者需要在发现漏洞上花费比攻击者更多令牌。这类似于加密货币的“工作量证明”（Proof of Work），成功不再取决于聪明才智，而取决于谁愿意投入更多的计算资源（令牌）。
AI 代理的“循环”（Loops） Claude Code 的创建者 Boris Cherny 提出的“循环”概念引发了行业兴奋。其核心思想是让 AI 代理在完成任务后自动重启提示词，通过迭代逐步解决复杂问题，无需人类持续监督。虽然“循环”的概念早在去年就已存在（曾被称为“Ralph Wiggum 循环”），但随着模型能力的提升，它现在变得真正可行。这标志着 AI 从“辅助工具”向“自主执行者”的转变，而支撑这一转变的正是对令牌成本的重新评估。

关键要点

策略性强制：早期的“Tokenmaxxing”并非管理失误，而是高管为了打破员工对 AI 的抵触情绪，故意采用的强制性推广手段。
范式转移：AI 应用的核心逻辑已从“避免复合错误”转变为追求“复合正确”。在高质量模型支持下，增加令牌投入能显著提升结果准确性。
成本结构变化：随着 AI 公司上市，免费或低价的令牌补贴正在消失，企业必须重新评估 AI 使用的 ROI（投资回报率）。
新的激励机制：虽然基于刷数据的“Tokenmaxxing”已死，但基于“投入越多、效果越好”的新逻辑正在形成。在网络安全等领域，这已演变为一种“算力军备竞赛”。
自主代理的兴起：通过“循环”机制，AI 代理能够长时间无人值守运行并自我修正，这依赖于模型对额外令牌投入的响应能力，而非过去的错误累积。

意义与影响

企业 AI 战略的重构：企业不应再简单地将 AI 令牌视为需要削减的成本中心，而应将其视为一种可以购买“准确性”和“自动化程度”的资源。在关键任务中，适当的超额令牌投入可能是确保结果可靠性的必要手段。
AI 代理（Agents）的实用化拐点： “复合正确”概念的确立，标志着 AI 代理从“需要严密监控的半成品”向“可信赖的自主执行者”迈进。这将加速 AI 在代码迁移、竞品分析、持续监控等长周期、高复杂度任务中的应用。
安全领域的博弈升级：网络安全将进入“令牌消耗战”。防御方的优势不再仅依赖于算法的优越性，更依赖于持续投入计算资源的能力。这可能导致安全基础设施的成本结构发生永久性改变。
对“效率”定义的重新审视：传统的“少花钱多办事”逻辑在 AI 时代可能不再适用。在某些场景下，“多花钱（令牌）以换取更高的正确率和更低的返工率”才是更高效的商业策略。
行业成熟度的标志：从“Ralph Wiggum 循环”到成熟的“循环”机制，反映了 AI 行业从概念炒作走向工程化落地的成熟过程。行业关注点已从“如何让人用起来”转向“如何让机器自主跑起来”。

查看原文 →12gramsofcarbon.com