← 返回信息流
Agent SkillLINUX DO · AI·2026/5/15

Codex更新后隐藏耗Token功能被开启,单轮消耗约30万Token

原标题:Codex应用更新后,检查这个选项有没有被偷偷打开,隐藏耗token大户!

速览

Codex Mac版更新后,Suggested prompts功能被意外开启,导致在切换项目焦点时后台自动运行Agent生成建议。该过程会读取Git状态、代码及工具信息,单轮触发约8-14个请求,输入消耗高达30万Token。由于默认使用高成本模型且缓存命中率较低,用户可能因此产生意外的高额API费用。

AI 深度解读

背景

OpenAI 近期更新了 macOS 端的 Codex 应用(版本号 26.513.20950),界面视觉体验得到优化。然而,部分用户在更新后通过 API 监控发现,后台请求量出现异常激增,导致 Token 消耗大幅上升。经排查,这一现象并非由用户主动发起的正常任务引起,而是应用设置中一个名为“Suggested prompts”(建议提示)的功能在后台自动触发所致。相比之下,Codex CLI 版本并未出现此问题。

核心内容

1. 问题根源:隐藏的自动触发机制 更新后的 Codex 应用中,“Suggested prompts”选项默认或意外被开启。该功能会在每次项目窗口获得焦点时,在后台自动启动一个 Agent,向 LLM 发送特定 Prompt,以生成针对当前本地项目的个性化建议。

触发该功能的系统级 Prompt 为:

"Generate 0 to 3 hyperpersonalized suggestions for what this user can do with Codex in this local project:<Path>"

2. 资源消耗数据 根据用户提供的 API 日志统计,该功能在后台静默运行,消耗了大量算力资源:

  • 触发频率与规模:在问题暴露期间,共触发了 28 轮建议生成请求。平均每轮触发 8.1 次 API 请求,单轮最多达到 14 次请求。
  • Token 消耗:单轮建议生成请求的输入 Token 约为 30 万。
  • 费用影响:默认调用模型为 gpt-5.4(注:此处原文提及 gpt-5.4,可能指代特定版本或内部代号,通常对应高算力模型),单次触发费用约为 0.2 美元。在夜间无正常任务期间,该功能持续运行,导致用户额外消耗了约 7-8 美元的费用。
  • 缓存效率低下:正常任务的缓存命中率为 95.6%,而建议请求的缓存命中率仅为 81.8%,导致大量重复计算和 Token 浪费。

3. 请求链路与行为分析 每一轮“建议生成”都是一次完整的 Agent 调用,会加载项目内的所有 harness、tools 和 skills。其典型请求链路如下:

  1. 初始化:发出建议 Prompt。
  2. 资源扫描:调用 list_mcp_resources(通常为空)。
  3. 上下文收集:Agent 进行“自言自语”(printf),准备收集上下文。
  4. Git 状态读取:读取 git statusgit log
  5. 文件系统扫描
    • 使用 find 扫描所有子仓库。
    • 调用 list_apps
    • 尝试读取 get_app_state 获取 Chrome、VSCode、AyuGram (Telegram) 等应用的状态(通常因权限被 MCP 拒绝)。
    • 读取 .logs/ 目录及 .md 文件。
  6. 深度代码分析:读取特定报告(如 docs/codex-suggestion-token-drain.md)及性能指标代码,最终生成建议。

4. 异常行为特征

  • 无界面反馈:尽管后台频繁请求,但用户界面上并未显示任何建议内容,造成“只耗资源不产出”的现象。
  • 断线重连风暴:当连接到连接不稳定的端点时,一旦请求中断,后台进程会不断重试,导致请求量进一步飙升。
  • 持续后台运行:即使在 VSCode 代码审查任务暂停后,该后台进程仍在持续发送请求,直到用户发现异常。

关键要点

  • 检查设置:Mac 端 Codex 用户应立即检查设置中的 “Suggested prompts” (建议提示) 选项,若无需此功能,建议关闭。
  • CLI 无此问题:该 Bug 或设计缺陷仅存在于 macOS 图形界面应用中,Codex CLI 版本未受影响。
  • 高成本陷阱:单次触发消耗约 30 万输入 Token,且缓存命中率低,是典型的“隐形”高耗 Token 大户。
  • 权限滥用风险:该功能试图读取多种应用状态(Chrome, VSCode 等)及系统日志,虽大部分被 MCP 权限拦截,但仍展示了其广泛的上下文收集意图。
  • 模型调用默认值:默认使用高算力模型(原文提及 gpt-5.4),加剧了费用负担。

意义与影响

这一事件揭示了当前 AI 客户端应用开发中存在的几个关键问题:

  1. 默认设置的风险:将高成本、高资源消耗的功能默认开启或隐蔽开启,而未给予用户明确的感知和控制,极易导致用户遭受意外的经济损失(Token 账单激增)。
  2. 后台进程透明度缺失:后台 Agent 的静默运行缺乏有效的用户通知机制(如状态栏提示或日志通知),使得用户难以及时发现异常。
  3. 上下文收集的边界:AI 助手在获取项目上下文时,过度扫描文件系统、Git 历史甚至其他应用状态,不仅浪费资源,还可能引发隐私和安全方面的担忧(尽管当前受限于 MCP 权限)。
  4. 缓存优化不足:对于频繁触发的自动化任务,若不能有效利用缓存,将造成巨大的算力浪费。

对于用户而言,此案例是一个警示:在使用具备自动化工具的 AI 客户端时,需密切关注 API 用量监控,并仔细审查应用设置中的自动化选项。对于开发者而言,则需重新评估后台自动触发功能的必要性、默认行为及资源消耗控制策略。

查看原文 →linux.do