Agent SkillLINUX DO · AI·2026/5/15

Codex更新后隐藏耗Token功能被开启，单轮消耗约30万Token

原标题：Codex应用更新后，检查这个选项有没有被偷偷打开，隐藏耗token大户！

速览

Codex Mac版更新后，Suggested prompts功能被意外开启，导致在切换项目焦点时后台自动运行Agent生成建议。该过程会读取Git状态、代码及工具信息，单轮触发约8-14个请求，输入消耗高达30万Token。由于默认使用高成本模型且缓存命中率较低，用户可能因此产生意外的高额API费用。

AI 深度解读

背景

OpenAI 近期更新了 macOS 端的 Codex 应用（版本号 26.513.20950），界面视觉体验得到优化。然而，部分用户在更新后通过 API 监控发现，后台请求量出现异常激增，导致 Token 消耗大幅上升。经排查，这一现象并非由用户主动发起的正常任务引起，而是应用设置中一个名为“Suggested prompts”（建议提示）的功能在后台自动触发所致。相比之下，Codex CLI 版本并未出现此问题。

核心内容

1. 问题根源：隐藏的自动触发机制 更新后的 Codex 应用中，“Suggested prompts”选项默认或意外被开启。该功能会在每次项目窗口获得焦点时，在后台自动启动一个 Agent，向 LLM 发送特定 Prompt，以生成针对当前本地项目的个性化建议。

触发该功能的系统级 Prompt 为：

"Generate 0 to 3 hyperpersonalized suggestions for what this user can do with Codex in this local project:<Path>"

2. 资源消耗数据 根据用户提供的 API 日志统计，该功能在后台静默运行，消耗了大量算力资源：

触发频率与规模：在问题暴露期间，共触发了 28 轮建议生成请求。平均每轮触发 8.1 次 API 请求，单轮最多达到 14 次请求。
Token 消耗：单轮建议生成请求的输入 Token 约为 30 万。
费用影响：默认调用模型为 gpt-5.4（注：此处原文提及 gpt-5.4，可能指代特定版本或内部代号，通常对应高算力模型），单次触发费用约为 0.2 美元。在夜间无正常任务期间，该功能持续运行，导致用户额外消耗了约 7-8 美元的费用。
缓存效率低下：正常任务的缓存命中率为 95.6%，而建议请求的缓存命中率仅为 81.8%，导致大量重复计算和 Token 浪费。

3. 请求链路与行为分析 每一轮“建议生成”都是一次完整的 Agent 调用，会加载项目内的所有 harness、tools 和 skills。其典型请求链路如下：

初始化：发出建议 Prompt。
资源扫描：调用 list_mcp_resources（通常为空）。
上下文收集：Agent 进行“自言自语”（printf），准备收集上下文。
Git 状态读取：读取 git status 和 git log。
文件系统扫描：
- 使用 find 扫描所有子仓库。
- 调用 list_apps。
- 尝试读取 get_app_state 获取 Chrome、VSCode、AyuGram (Telegram) 等应用的状态（通常因权限被 MCP 拒绝）。
- 读取 .logs/ 目录及 .md 文件。
深度代码分析：读取特定报告（如 docs/codex-suggestion-token-drain.md）及性能指标代码，最终生成建议。

4. 异常行为特征

无界面反馈：尽管后台频繁请求，但用户界面上并未显示任何建议内容，造成“只耗资源不产出”的现象。
断线重连风暴：当连接到连接不稳定的端点时，一旦请求中断，后台进程会不断重试，导致请求量进一步飙升。
持续后台运行：即使在 VSCode 代码审查任务暂停后，该后台进程仍在持续发送请求，直到用户发现异常。

关键要点

检查设置：Mac 端 Codex 用户应立即检查设置中的 “Suggested prompts” (建议提示) 选项，若无需此功能，建议关闭。
CLI 无此问题：该 Bug 或设计缺陷仅存在于 macOS 图形界面应用中，Codex CLI 版本未受影响。
高成本陷阱：单次触发消耗约 30 万输入 Token，且缓存命中率低，是典型的“隐形”高耗 Token 大户。
权限滥用风险：该功能试图读取多种应用状态（Chrome, VSCode 等）及系统日志，虽大部分被 MCP 权限拦截，但仍展示了其广泛的上下文收集意图。
模型调用默认值：默认使用高算力模型（原文提及 gpt-5.4），加剧了费用负担。

意义与影响

这一事件揭示了当前 AI 客户端应用开发中存在的几个关键问题：

默认设置的风险：将高成本、高资源消耗的功能默认开启或隐蔽开启，而未给予用户明确的感知和控制，极易导致用户遭受意外的经济损失（Token 账单激增）。
后台进程透明度缺失：后台 Agent 的静默运行缺乏有效的用户通知机制（如状态栏提示或日志通知），使得用户难以及时发现异常。
上下文收集的边界：AI 助手在获取项目上下文时，过度扫描文件系统、Git 历史甚至其他应用状态，不仅浪费资源，还可能引发隐私和安全方面的担忧（尽管当前受限于 MCP 权限）。
缓存优化不足：对于频繁触发的自动化任务，若不能有效利用缓存，将造成巨大的算力浪费。

对于用户而言，此案例是一个警示：在使用具备自动化工具的 AI 客户端时，需密切关注 API 用量监控，并仔细审查应用设置中的自动化选项。对于开发者而言，则需重新评估后台自动触发功能的必要性、默认行为及资源消耗控制策略。

查看原文 →linux.do

Codex更新后隐藏耗Token功能被开启，单轮消耗约30万Token

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐