Codex更新后隐藏耗Token功能被开启,单轮消耗约30万Token
速览
Codex Mac版更新后,Suggested prompts功能被意外开启,导致在切换项目焦点时后台自动运行Agent生成建议。该过程会读取Git状态、代码及工具信息,单轮触发约8-14个请求,输入消耗高达30万Token。由于默认使用高成本模型且缓存命中率较低,用户可能因此产生意外的高额API费用。
AI 深度解读
背景
OpenAI 近期更新了 macOS 端的 Codex 应用(版本号 26.513.20950),界面视觉体验得到优化。然而,部分用户在更新后通过 API 监控发现,后台请求量出现异常激增,导致 Token 消耗大幅上升。经排查,这一现象并非由用户主动发起的正常任务引起,而是应用设置中一个名为“Suggested prompts”(建议提示)的功能在后台自动触发所致。相比之下,Codex CLI 版本并未出现此问题。
核心内容
1. 问题根源:隐藏的自动触发机制 更新后的 Codex 应用中,“Suggested prompts”选项默认或意外被开启。该功能会在每次项目窗口获得焦点时,在后台自动启动一个 Agent,向 LLM 发送特定 Prompt,以生成针对当前本地项目的个性化建议。
触发该功能的系统级 Prompt 为:
"Generate 0 to 3 hyperpersonalized suggestions for what this user can do with Codex in this local project:<Path>"
2. 资源消耗数据 根据用户提供的 API 日志统计,该功能在后台静默运行,消耗了大量算力资源:
- 触发频率与规模:在问题暴露期间,共触发了 28 轮建议生成请求。平均每轮触发 8.1 次 API 请求,单轮最多达到 14 次请求。
- Token 消耗:单轮建议生成请求的输入 Token 约为 30 万。
- 费用影响:默认调用模型为 gpt-5.4(注:此处原文提及 gpt-5.4,可能指代特定版本或内部代号,通常对应高算力模型),单次触发费用约为 0.2 美元。在夜间无正常任务期间,该功能持续运行,导致用户额外消耗了约 7-8 美元的费用。
- 缓存效率低下:正常任务的缓存命中率为 95.6%,而建议请求的缓存命中率仅为 81.8%,导致大量重复计算和 Token 浪费。
3. 请求链路与行为分析 每一轮“建议生成”都是一次完整的 Agent 调用,会加载项目内的所有 harness、tools 和 skills。其典型请求链路如下:
- 初始化:发出建议 Prompt。
- 资源扫描:调用
list_mcp_resources(通常为空)。 - 上下文收集:Agent 进行“自言自语”(printf),准备收集上下文。
- Git 状态读取:读取
git status和git log。 - 文件系统扫描:
- 使用
find扫描所有子仓库。 - 调用
list_apps。 - 尝试读取
get_app_state获取 Chrome、VSCode、AyuGram (Telegram) 等应用的状态(通常因权限被 MCP 拒绝)。 - 读取
.logs/目录及.md文件。
- 使用
- 深度代码分析:读取特定报告(如
docs/codex-suggestion-token-drain.md)及性能指标代码,最终生成建议。
4. 异常行为特征
- 无界面反馈:尽管后台频繁请求,但用户界面上并未显示任何建议内容,造成“只耗资源不产出”的现象。
- 断线重连风暴:当连接到连接不稳定的端点时,一旦请求中断,后台进程会不断重试,导致请求量进一步飙升。
- 持续后台运行:即使在 VSCode 代码审查任务暂停后,该后台进程仍在持续发送请求,直到用户发现异常。
关键要点
- 检查设置:Mac 端 Codex 用户应立即检查设置中的 “Suggested prompts” (建议提示) 选项,若无需此功能,建议关闭。
- CLI 无此问题:该 Bug 或设计缺陷仅存在于 macOS 图形界面应用中,Codex CLI 版本未受影响。
- 高成本陷阱:单次触发消耗约 30 万输入 Token,且缓存命中率低,是典型的“隐形”高耗 Token 大户。
- 权限滥用风险:该功能试图读取多种应用状态(Chrome, VSCode 等)及系统日志,虽大部分被 MCP 权限拦截,但仍展示了其广泛的上下文收集意图。
- 模型调用默认值:默认使用高算力模型(原文提及 gpt-5.4),加剧了费用负担。
意义与影响
这一事件揭示了当前 AI 客户端应用开发中存在的几个关键问题:
- 默认设置的风险:将高成本、高资源消耗的功能默认开启或隐蔽开启,而未给予用户明确的感知和控制,极易导致用户遭受意外的经济损失(Token 账单激增)。
- 后台进程透明度缺失:后台 Agent 的静默运行缺乏有效的用户通知机制(如状态栏提示或日志通知),使得用户难以及时发现异常。
- 上下文收集的边界:AI 助手在获取项目上下文时,过度扫描文件系统、Git 历史甚至其他应用状态,不仅浪费资源,还可能引发隐私和安全方面的担忧(尽管当前受限于 MCP 权限)。
- 缓存优化不足:对于频繁触发的自动化任务,若不能有效利用缓存,将造成巨大的算力浪费。
对于用户而言,此案例是一个警示:在使用具备自动化工具的 AI 客户端时,需密切关注 API 用量监控,并仔细审查应用设置中的自动化选项。对于开发者而言,则需重新评估后台自动触发功能的必要性、默认行为及资源消耗控制策略。
