OpenAI报告:Codex成主力,内部员工90%工作由AI代理完成
速览
OpenAI发布报告揭示Codex正从代码工具转向通用工作流,内部员工90%以上工作量由AI代理完成。数据显示,非技术岗位如法务、招聘的使用率呈百倍增长,任务复杂度显著提升。这标志着AI应用从问答转向执行,重塑企业工作形态。
AI 深度解读
背景
近期,关于 OpenAI 新模型 GPT-5.6 的监管动态引发了广泛关注。据外媒报道,美国政府出于安全评估的考量,要求 OpenAI 将 GPT-5.6 的早期访问权限严格限制在少数经过批准的企业客户中,导致该模型尚未大规模面向公众发布便面临严格的审核与分阶段发布要求。
几乎在同一时间,OpenAI 发布了一份名为《The Shift to Agentic AI: Evidence from Codex》(向智能体 AI 的转变:来自 Codex 的证据)的研究报告。这份报告深入剖析了 OpenAI 自家产品 Codex 的使用数据。Codex 是一款能够读取文件、执行命令、修改代码、生成文档并调用工具的 Agent 产品。报告中的数据显示,AI 的角色正在从单纯的“回答问题”向“替人完成一段工作”发生实质性转变,这种能力的跃升或许正是监管层对 GPT-5.6 持谨慎态度的重要背景。
核心内容
这份报告通过大量内部数据,揭示了 AI 在工作流中渗透的深度与广度,主要涵盖以下几个维度:
1. 使用强度的指数级跃升 OpenAI 内部数据显示,AI 的使用重心已从 ChatGPT 全面转向 Codex。
- Token 消耗占比: 2025 年 8 月,OpenAI 员工在 Codex 上的 Token 花费不足总量的 10%;而到了今年 6 月,超过 90% 的工作量由 Codex 承担。目前,Codex 贡献了 OpenAI 每周上千万亿 Token 中的 99.8%。
- 活跃用户比例: 在 OpenAI 活跃员工中,97.9% 的人使用过 Codex。
- 极端使用案例: 按每日运行时长排序,处于第 99 百分位的顶端重度用户,平均每天产生超过 60 小时的 Codex 智能体运行时间。由于多个 Agent 并行运行,部分用户一天的累计运行时间甚至超过 71 小时。
2. 用户群体的扩散与分层 报告将用户分为个人用户、外部组织用户和 OpenAI 员工三类,揭示了不同的 adoption(采用)曲线:
- 采用率差异: 截至 2026 年 6 月 11 日前的 28 天内,个人活跃用户中仅有 0.7% 使用过 Codex,外部组织用户为 17.3%,而 OpenAI 内部接近全员使用(97.9%)。
- 输出占比差异: 尽管个人用户采用率低,但一旦使用,强度极高。个人用户中 Codex 贡献了 16.5% 的输出 Token;外部组织用户中这一比例高达 63.3%;OpenAI 内部更是达到 99.8%。
- 非开发者崛起: Codex 的增长不再仅由开发者驱动。2026 年 6 月,外部组织账号中非开发者活跃用户数量较 2025 年 8 月增长近 189 倍,个人账号中非开发者增长超过 130 倍。扩散路径正从程序员延伸至文档、数据、研究、销售、招聘、法务和运营人员。
3. 任务复杂度与工作流重构
- 任务类型: 软件相关任务仍占大头,包括写代码、读代码、修 Bug、跑测试、配置环境等。但在 OpenAI 内部及外部组织中,任务范围已扩展至研究、数据分析,以及由销售、市场、招聘等岗位生成的文档、报告和说明材料。
- 任务变重: 任务复杂度显著增加。在个人用户中,提交过“熟练人类需 1 小时以上”任务的比例从 2025 年 12 月的 35.4% 升至 2026 年 5 月的 70.2%;提交过“8 小时以上”任务的比例从 2.1% 升至 25.6%。
- 使用方式变化: 用户开始管理并发任务(同时运行多个 Agent),并沉淀可复用的流程(Skill)。调用 Skill 的比例从 2026 年 3 月的 5.4% 升至 6 月的 26.6%(OpenAI 内部高达 96.2%)。
4. 岗位渗透率
- 外部组织: 工程技术岗位平均 Codex 输出占比最高(26.8%),数据和分析岗位约为 15.2%,法务等非技术岗位较低(1.9%)。
- OpenAI 内部: 曲线更为激进。2026 年初,法务、招聘等岗位几乎未使用 Codex;至 4 月,这些岗位的输出占比已迅速攀升至与工程、数据岗位相当的水平。
关键要点
- 范式转移: AI 的应用指标已从“是否使用”转变为“交付了多少工作量”。AI 正从聊天助手转变为执行具体工作任务的 Agent。
- 内部验证: OpenAI 自身已成为 Codex 的最大重度用户,内部工作流已高度依赖 Codex,且非技术岗位(如法务、HR)的使用速度惊人,展示了未来企业工作形态的潜在样貌。
- 用户基数与深度反差: 尽管在免费/付费套餐用户中,使用 Codex 的比例不足 1%,但核心用户的使用强度极高,且外部组织用户的采用率和输出占比远高于个人用户。
- 能力边界扩展: Codex 不仅能处理代码,还能处理文档生成、数据分析和业务流程自动化。用户开始通过“Skill”将重复工作标准化、流程化。
- 监管敏感性来源: 当 AI 从“生成文本”变为“执行任务、调用工具、读写文件”时,其风险性质发生了改变。这种能力接近基础设施上线,一旦出错可能直接影响真实工作流,因此 GPT-5.6 等更强模型的发布面临更严格的安全审查。
意义与影响
Codex 报告揭示的趋势表明,AI 正在重塑组织的工作方式。
首先,“用不用 AI”已成为过时问题。随着 Agent 能够并行处理多个任务(如一个查资料、一个改脚本、一个生成表格),人类角色正从执行者转变为项目经理或编辑,负责分配任务和审核结果。这种工作流的改变要求企业和员工重新安排日常职责,重点在于“给 AI 分配任务”的能力。
其次,非技术岗位的 AI 化正在加速。虽然目前工程师和数据分析师是主要用户,但 Codex 在法务、招聘、销售等领域的快速渗透,预示着 AI 将打破技术壁垒,成为通用生产力工具。OpenAI 内部非技术岗位在短短几个月内从几乎零使用到与工程部门持平,证明了在权限开放和培训到位的情况下,普通员工也能高效利用 Agent 工具。
最后,监管与发展的平衡成为关键议题。Codex 展现出的强大执行能力,使得 AI 的风险评估不再局限于内容安全,更涉及操作安全和流程合规。GPT-5.6 面临的监管阻力,正是这种能力跃升带来的必然结果。当 AI 具备实质性的工作执行能力时,其发布节奏将更接近关键基础设施的上线标准,而非普通软件产品的迭代。这要求开发者和用户在享受效率红利的同时,必须建立更严谨的安全评估和流程管控机制。
