GitHub 热榜GitHub Trending · 周·7 天前

Oh My Pi：基于终端的AI编程智能体

原标题：can1357/oh-my-pi

TypeScript★ 7,843 stars+2,508 本周

速览

该项目是一个功能强大的终端AI编程智能体，支持哈希锚定编辑、LSP集成、Python执行及浏览器控制等核心功能。通过优化的工具链和子智能体架构，为开发者提供流畅的终端内AI辅助编码体验。

AI 深度解读

oh-my-pi：深度解析下一代 IDE 集成编码智能体

这是什么

oh-my-pi (简称 omp) 是一个基于 TypeScript 构建的高级编码智能体（Coding Agent），其核心由约 27,000 行 Rust 代码驱动。它并非简单的脚本封装，而是一个“将 IDE 直接连线”的完整智能体表面（Agent Surface）。

该项目是 Mario Zechner 开发的 Pi 项目的分支，但在功能深度、工具链集成和实时调优上进行了大幅扩展。omp 旨在提供一个开箱即用、完全开放且经过真实世界用例持续打磨的开发环境。它支持 macOS、Linux 和 Windows 平台，并通过内置的 40+ 模型提供商、32 种内置工具、13 项 LSP 操作和 27 项 DAP 操作，构建了一个极其强大的本地开发辅助系统。

解决的问题

传统的 AI 编码助手或自动化脚本通常存在以下痛点，omp 旨在逐一解决：

上下文割裂与“打印调试”依赖：大多数智能体缺乏对 IDE 内部状态的感知，往往通过简单的文件读取或 print 语句来调试，效率低下。omp 直接利用 LSP 和 DAP 协议，让智能体拥有与人类开发者相同的代码理解力和调试能力。
工具链碎片化：其他方案往往通过 shell 调用 rg、grep 或 find，这不仅涉及高昂的 fork-exec 开销，还依赖外部二进制文件的存在。omp 将 ripgrep、glob 和 find 等核心搜索工具直接链接到进程内部，实现零开销的本地搜索。
编辑冲突与状态不同步：传统编辑容易因文件内容变更导致锚点失效，产生“String not found”错误。omp 引入了基于内容哈希的锚点机制，在应用补丁前自动检测并拒绝过时的修改，确保原子性。
配置迁移地狱：用户通常需要将现有的规则文件（如 Cursor MDC、Cline .clinerules 等）转换为特定格式。omp 原生支持多种主流格式，无需迁移脚本即可直接复用团队现有的配置。
调试与重构的复杂性：面对 C 语言段错误、Go 语言死锁或 Python 进程挂起，普通智能体束手无策。omp 能够直接附加 lldb、dlv 或 debugpy，进行底层的栈帧读取和变量检查。

核心功能

omp 的功能体系围绕“感知、执行、协调”三个维度构建，包含 32 种核心工具：

1. 智能感知与搜索

read：不仅仅是读取文本，它能总结文件内容，支持文件、目录、归档、SQLite、PDF、Notebook 甚至内部 URL。它返回的是摘要而非原始内容的堆砌。
search：基于正则表达式的快速搜索，支持文件、Globs 和内部 URL。
find：基于 Glob 的路径查找。
ast_grep：基于 tree-sitter 的 50+ 种语法结构的代码查询。

2. 精准编辑与重构

edit：基于哈希行（hashline）的补丁编辑，支持内容哈希锚点和过时锚点恢复机制，避免编辑冲突。
ast_edit：结构化的代码重写，在应用前预览替换计数，通过 ast-grep 进行深层结构修改。
lsp：直接调用 IDE 的 LSP 能力，包括诊断、导航、符号重命名、代码操作等。重命名操作会触发 workspace/willRenameFiles，自动更新导出、Barrel 文件和别名导入。

3. 运行时与调试

bash：工作区 Shell，支持 PTY 或后台任务分发。
eval：持久化的 Python 和 JavaScript 单元格，拥有共享的前置代码和工具重入能力。智能体可以在 Python 中读取 CSV，在 JavaScript 中绘图，无需离开单元格。
debug：驱动 DAP 会话，支持断点、单步执行、线程和栈帧检查。
recipe：自动检测并调用任务运行器（如 bun, just, make, cargo）中的目标。

4. 协调与代理

task：并行分发子代理，每个子代理拥有隔离的工作树和工具表面，最终返回经过模式验证的结构化对象，避免文本解析和合并冲突。
web_search：串联 14 个排名靠前的提供商，将搜索结果直接传递给 read，返回带有锚点的结构化 Markdown。
browser：通过 Puppeteer 控制无头 Chromium 或 CDP 附加的应用程序，支持 Stealth 模式以模拟正常用户行为。

亮点 / 与同类相比

1. 原生进程内集成（In-Process Integration）

大多数智能体通过 Shell 调用外部工具，而 omp 将 ripgrep、glob 和 find 等核心二进制文件直接链接到 Rust 核心中。这意味着搜索和查找操作是进程内的，速度极快，且不依赖外部二进制文件的存在。

2. 智能锚点与原子编辑

omp 使用内容哈希锚点来定位编辑位置。如果文件在模型生成补丁期间发生变化，锚点会发散，omp 会拒绝补丁以防止数据损坏。这种机制显著减少了 Token 消耗（例如 Grok 4 Fast 模型在此模式下输出 Token 减少 61%），并消除了“String not found”循环。

3. 深度调试能力

不同于仅能打印日志的智能体，omp 能够：

C/C++：附加 lldb，单步执行至错误指针，读取栈帧。
Go：附加 dlv，遍历 Goroutines 以排查死锁。
Python：使用 debugpy 暂停进程，检查并评估变量。

4. 规则注入与上下文校正

omp 允许用户定义规则，这些规则在模型偏离脚本时才会激活。通过正则匹配中断流，注入规则作为系统提醒，并从同一点重试。这种机制避免了在每个回合都支付上下文税，且注入内容在压缩后依然有效。

5. 统一的接口抽象

GitHub 集成：不单独提供 gh_issue_view 等工具，而是将 PR 和 Issue 视为路径，通过统一的 read 接口访问，减少模型学习成本。
内部 URL 方案：支持 pr://, issue://, agent:// 等内部方案，使智能体可以通过路径直接访问 PR 差异、子代理输出等内部状态。

6. 冲突解决自动化

每个合并冲突被映射为一个 URL。智能体可以直接向 conflict://N 写入 @theirs、@ours 或 @base，实现一键解决冲突。

适合谁用 / 上手

适合人群

追求极致效率的高级开发者：需要智能体具备 IDE 级别的代码理解和调试能力，而不仅仅是代码补全。
多语言/复杂项目维护者：项目涉及 C/C++、Go、Python 等多种语言，且需要深度调试和重构。
重视配置复用的团队：希望保留现有的 LLM 规则文件（如 Cline, Cursor 配置），无需迁移即可使用。
本地优先主义者：希望在不依赖外部沙箱或复杂桥接的情况下，在本地环境中运行强大的 AI 辅助工具。

上手指南

系统要求：

macOS, Linux, Windows
Bun ≥ 1.3.14 (推荐)

安装方式：

一键安装 (macOS/Linux)：
```
curl -fsSL https://omp.sh/install | sh
```

使用 Bun 安装 (推荐)：

bun install -g @oh-my-pi/pi-coding-agent

Windows (PowerShell)：
```
irm https://omp.sh/install
```

查看原文 →github.com