← 返回信息流
Agent SkillLINUX DO · AI·29 天前

开源项目让Codex对接微信:实现手机端审批与交互

原标题:Codex但微信版(重复造轮子之让你的Codex对接OpenClaw微信渠道插件)

速览

该开源项目将AI编程助手Codex接入微信,使用户可通过手机端与Codex交互并审批执行命令。项目解决了微信渠道的消息限流问题,仅推送最终结果和审批信息,并优化了文件发送机制。开发者采用中间件架构,便于后续适配飞书等其他平台。

AI 深度解读

深度解读:Codex 微信版插件与 OpenClaw 的替代之路

背景

年初,OpenClaw 因其将 AI 模型接入微信官方机器人渠道的能力而迅速走红。然而,随着热潮退去,开发者在实际使用中逐渐暴露出 OpenClaw 的诸多痛点。首先,OpenClaw 存在严重的性能 Bug,例如在版本更新后导致 CPU 占用率居高不下且反复重启。其次,OpenClaw 的 Token 消耗较高,性价比不如新兴的 Codex。

与此同时,Anthropic 的 Codex 产品经历了显著进化。Codex 不仅开源,还集成了操控电脑的能力,其性能表现和 Token 效率均优于 OpenClaw。特别是 Codex 新推出的 /goal 模式,展示了更强的任务执行能力。

在此背景下,作者基于此前未完善的中间件项目 OpenMOSS 的思想,开发了一个名为“Codex 微信版”的插件。该项目旨在通过中间件架构,将 Codex 的能力对接至微信渠道,解决 OpenClaw 的性能与成本问题,同时利用 Codex 的新特性提供更稳定的交互体验。

核心内容

该项目是一个开源的中间件插件,核心功能是将 Anthropic 的 Codex 接入微信,实现移动端与 AI 的深度交互。以下是项目的具体实现逻辑与功能细节:

1. 项目起源与动机

作者最初尝试使用 Codex 的 /goal 模式进行长周期任务测试,发现其稳定性远超 OpenClaw。在经历了一整夜(凌晨2点)的测试验证后,确认了通过中间件对接微信的可行性,从而正式开启该项目。这被视为之前提出的 OpenMOSS 中间件思想的一次具体实践与完善。

2. 技术架构与开发方式

  • 技术栈:项目基于 TypeScript 和 Node.js 开发。
  • 开发模式:采用 Vibe Coding 模式,由人类开发者与 Codex 共同完成代码编写。所有设计文档、测试文档及提交记录均完整开源在仓库中。
  • 架构理念:采用“中间件”思想,将通讯渠道插件与核心逻辑解耦。中间件被设计为通用协议,旨在方便对接不同的通讯平台(如飞书等)。

3. 核心功能与使用流程

  • 会话管理:启动后,用户需选择与 Codex 的历史对话 Session。此后,所有微信端的对话上下文均写入该 Session。
  • 权限控制与审批:支持手机端对 Codex 执行的命令进行审批。作者建议不要赋予 Codex 全部权限,而是通过微信端进行人工审核,以保障安全。
  • 多端同步限制
    • CLI 或 Codex App 端无法实时看到微信端的对话效果,但上下文已同步。
    • 用户需在 Codex App 中重新打开对应的 Session 以查看最新状态。
    • 严禁在同一 Session 中同时在电脑端和微信端对话,因为两者不会实时双向同步。建议为微信端开启独立的会话。

4. 微信渠道的特殊适配

  • 限流处理:微信官方对机器人消息发送有严格的限流策略。作者发现初始版本将所有消息投递至微信会导致发送失败,因此对中间件进行了精简,仅向微信发送“最终结果”和“审批消息”,屏蔽中间过程日志。Codex 的详细进度仍可在终端查看。
  • 文件发送机制:为了解决 Codex 在微信中发送文件的问题,作者定义了 /sendfile 命令。该命令会在消息前注入特定提示词,引导 Codex 输出特定格式,中间件解析该格式后实现文件发送。

5. 当前状态与未来规划

  • 平台支持:目前仅在 Mac 环境下经过实际测试,Windows 版本尚未验证。
  • 多平台适配:目前不考虑适配多平台,但计划后续适配飞书。由于采用了通用协议架构,其他开发者可基于此轻松开发适配插件。

关键要点

  • 替代 OpenClaw:项目旨在解决 OpenClaw 存在的 CPU 高占用、频繁重启等性能 Bug,以及 Token 消耗高的问题。
  • 利用 Codex 新特性:充分利用 Codex 开源、低 Token 消耗、电脑操控能力及 /goal 模式的优势。
  • 中间件架构:采用 TS + Node.js 开发的中间件,将通讯渠道抽象为通用协议,便于后续扩展至飞书等其他平台。
  • 安全审批机制:支持手机端审批 Codex 执行的命令,避免赋予 AI 过高权限带来的风险。
  • 微信限流优化:针对微信官方机器人的消息限流策略,精简了发送给微信的消息内容,仅保留最终结果和审批请求,中间过程仅在本地终端显示。
  • 会话隔离:微信端与电脑端(CLI/App)不实时双向同步,需手动切换或开启独立会话以避免冲突。
  • 文件传输方案:通过自定义 /sendfile 命令及提示词工程,解决微信渠道下文件发送的格式兼容问题。
  • 完全开源:项目包含完整的设计文档、测试文档及代码提交记录,支持 Fork 二次开发。

意义与影响

1. 推动 AI Agent 的移动端普及

通过将 Codex 接入微信这一高频社交场景,降低了用户与 AI 交互的门槛。用户可以在移动端随时随地与 AI 交流想法、下达指令,实现了 AI 助手的“随身化”。

2. 验证“中间件”架构在 AI 集成中的价值

该项目展示了通过中间件解耦 AI 核心能力与通讯渠道的可行性。这种架构不仅提高了系统的灵活性,还为不同 AI 模型(如 Codex)对接不同平台(微信、飞书等)提供了标准化路径,促进了开源社区的工具复用。

3. 优化 AI 使用的成本与体验

相较于 OpenClaw,Codex 更低的 Token 消耗和更稳定的性能,证明了选择更优模型和架构的重要性。同时,通过精简微信消息内容以规避限流,体现了在官方平台限制下进行工程优化的必要性。

4. 促进开源协作与 Vibe Coding 实践

项目全程由人类与 Codex 共同完成,并公开了所有设计文档和代码记录,为社区提供了“人机协作开发”的典型案例。这种透明化的开发过程有助于其他开发者快速理解项目逻辑并进行功能增强。

5. 安全交互的新范式

通过手机端审批机制,项目提供了一种在赋予 AI 执行权限的同时保障用户控制权的安全交互范式,这对于 AI Agent 在真实场景中的落地具有重要的参考价值。

查看原文 →linux.do