OpenAI Codex大降价在即,官方指南教你高效使用
速览
OpenAI正考虑大幅降低Codex费用以应对Anthropic竞争,同时Codex周活用户仅500万,亟需提升渗透率。为此官方发布详细指南,介绍Computer Use跨应用操作、/goal长期目标自动化及GPT Image 2生成PPT等核心功能。这些教程旨在帮助用户掌握Codex在代码迁移、原型开发及日常办公中的具体应用场景。
AI 深度解读
背景
近期,OpenAI 旗下的编程助手 Codex 在社交媒体上获得了极高的评价。除了即将并入全新改版 ChatGPT 应用的重大战略调整外,用户社区还自发探索出了一套“破解”速率限制的方法:通过邀请好友(无论是否为新用户或订阅用户)打开 Codex 并发送少量消息,即可重置自身的速率限制。
与此同时,OpenAI 官方在官网一口气更新了十余个真实世界的工作流案例,涵盖从网页部署、Mac/iOS 应用构建,到大型项目管理及长达 150 小时的科研任务。这些官方指南旨在解决用户对于“Codex 能做什么”以及“如何使用”的疑问,并提供了一套高效榨干额度的操作手册。
核心内容
Computer Use:让 AI 像人一样操作电脑
Codex 的 Computer Use 功能允许 AI 通过点击、查看和输入来操控电脑界面,适用于跨应用任务,如收集笔记、更新记录、复制细节或回复信息。
- 操作方式:在 Codex App 中开启 Computer Use 插件,在对话框输入指令时以
@Computer开头,或直接提及特定应用(如@Slack、@Messages)。 - 典型场景:
- 播放音乐以集中注意力。
- 将 Notes 中的面试笔记添加到飞书。
- 查看企业微信并添加当日待办事项提醒。
- 注意事项:
- 确保 Mac 在运行时不锁定,或在 Codex 中开启「锁屏操作」功能。
- 可在自定义设置中指定默认浏览器。
- 避免同时使用两个线程控制同一应用。
- 任务结束后,可要求 Codex 总结优化流程,将其转化为可重复的模式。
/goal 模式:赋予 AI 长期自主目标
/goal 命令旨在解决传统 AI 交互中需要人类不断干预、分步指导的问题。它允许用户设定一个明确的目标和收尾条件,让 Codex 在后台自主执行,直到任务完成或达到既定标准。
- 适用任务:介于单一提示词与完整待办清单之间的任务,目标明确且可自我验证。
- 典型用法:
- 项目迁移:将游戏、移动应用或代码库迁移至新技术栈或框架。
- 原型开发:从零构建新应用或功能,通过编写
PLAN.md明确需求,让 Codex 交付打磨过的初稿。 - 提示词优化:利用测试集和评测结果,让 Codex 自动迭代优化提示词,直至分数达标。
- 最佳实践:
- 明确目标与收尾条件。
- 指定 Codex 优先读取的文件、文档、Issue 或日志。
- 定义用于证明进度的命令或产物。
- 分阶段执行并记录简短进度日志。
- 随时使用
/goal查看状态,或在卡住/需变更方向时暂停或清除。
GPT Image 2 辅助制作 PPT
Codex 内置了 $$slides(基于 PptxGenJS 读写 .pptx)和 $$imagegen(生成配图)两项技能,可自动化处理 PPT 排版与设计。
- 操作逻辑:
- 提供 Logo、图片等资源文件夹。
- 通过提示词指定排版细节(如 Logo 位置、文本对齐、图表类型、品牌规范)。
- Codex 会渲染幻灯片图像,进行溢出和字体替换检查,修复布局问题后交付。
- 进阶应用:
- 定期报告:建立
guidelines.md确定内容结构与更新方式,配合数据拉取技能,快速生成周报、月报或股东汇报。 - 现有 PPT 修改:直接要求修正间距、文字错位等排版错误。
- 定期报告:建立
截图转网页:基于 Playwright 的精准还原
Codex 能够根据截图、设计说明或参考图,生成响应式界面,并复用项目现有的代码框架和语言,避免另起炉灶。
- 技术实现:配合
$playwright技能,Codex 可在真实浏览器中打开页面,对比不同屏幕尺寸下的截图,反复迭代直至视觉与行为高度匹配。 - 提示词关键要求:
- 重用现有设计系统组件。
- 严格匹配间距、布局、层级和响应行为。
- 尊重仓库的路由、状态和数据获取模式。
- 使用
$playwright-interactive进行最终验证和迭代。
从零构建浏览器游戏
Codex 不仅具备编码能力,还能理解游戏设计逻辑。构建游戏需先制定详细的规划文档。
- 规划阶段:
- 编写
PLAN.md:拆解玩家目标、核心循环、操作输入、胜负条件、视觉方向、技术栈及里程碑。 - 编写
AGENTS.md:定义技术栈(如 NextJS, Fastify, Postgres, Redis)、约定(如每步验证、日志记录)及所需技能。
- 编写
- 技能集成:
$$imagegen:生成美术素材。$$playwright:在浏览器中测试游戏画面与效果。$openai-docs:获取最新 API 文档。Context7 MCP:拉取渲染框架文档。
- 执行过程:Codex 依据计划自动执行,期间通过 Playwright 自测验证,无需人工频繁干预。若生成图片较多,可能需消耗大量 Token 并耗时数小时。
AI 自主科研助手
Codex 可作为长期科研助手,处理需要反复试错、取证和迭代的复杂科学任务。
- 案例一:模型架构优化
- 场景:测试蛋白质折叠假设(如增加高阶几何结构表示)。
- 流程:设定科学方向、基线模型及自动打分基准。Codex 自主实现、测试、记录实验、排查故障并迭代,最终产出如
SimplexFold这样的实验性架构。官方案例显示其可连续运行 150 多个小时。
- 案例二:药物靶点排序
- 场景:整合遗传学、临床、文献等多源数据。
- 流程:利用 Life Science Research 插件,并行从各数据库取证,按 1-5 分标准对每条证据线打分,最终汇集成排名表及热力图。
关键要点
- 速率限制重置技巧:邀请非新用户通过链接打开 Codex 并发送几条消息,即可重置邀请人的速率限制。
- Computer Use 核心:通过
@Computer指令调用,需确保电脑不锁定,适合跨应用自动化任务。 - /goal 模式精髓:提供明确目标、收尾条件及验证标准,实现 AI 的长期自主执行,减少人工干预。
- PPT 自动化:利用
$$slides和$$imagegen结合品牌规范,可实现 PPT 的批量生成与排版优化。 - UI 还原精度:结合
$playwright进行真实浏览器比对,可高保真地将截图转化为响应式代码。 - 游戏开发流程:依赖
PLAN.md和AGENTS.md进行结构化规划,集成图像生成与自动化测试技能。 - 科研自动化:适用于长周期、多迭代的科学实验,如模型架构搜索和跨数据库药物靶点分析。
- 官方资源:更多案例可访问 OpenAI 开发者官网的 Codex 用例页面。
意义与影响
Codex 的这些更新与功能扩展,标志着 AI 助手从单纯的“代码生成器”向“自主工作流执行者”的转变。
- 降低使用门槛与提升效率:通过
/goal和 Computer Use 等功能,用户无需具备深厚的编程细节知识或繁琐的操作
