GitHub 热榜GitHub Trending · 周·7 天前

CodeGraph：面向AI编程代理的本地化预索引代码知识图谱

原标题：colbymchenry/codegraph

TypeScript★ 29,715 stars+21,211 本周

速览

该项目为Claude Code、Cursor、Codex等主流AI编程代理提供100%本地运行的代码知识图谱支持。其核心亮点在于预索引机制，能够大幅减少上下文Token用量并优化工具调用效率，同时保障数据隐私与安全。

AI 深度解读

CodeGraph：为 AI 编程助手注入语义级代码智能

这是什么

CodeGraph 是一个开源的本地化代码索引与知识图谱工具，旨在通过提供语义级代码智能来增强主流 AI 编程助手（如 Claude Code, Cursor, Codex, OpenCode, Hermes Agent, Gemini, Antigravity 和 Kiro）的能力。

它不是一个简单的文件搜索工具，而是一个构建在代码结构之上的知识图谱引擎。它通过静态分析提取符号关系、调用图和代码结构，并将其转化为 Agent 可即时查询的索引。CodeGraph 的核心优势在于其“零依赖”架构：它捆绑了自己的运行时，无需 Node.js 环境，通过单一命令即可适配 macOS、Linux 和 Windows，实现了真正的跨平台一致性。

解决的问题

传统 AI 编程助手在理解大型代码库时，主要依赖基于文本的模式匹配（如 grep、glob）和逐文件读取（Read）。这种“盲目探索”模式存在显著痛点：

高昂的 Token 成本：Agent 需要消耗大量上下文窗口来扫描无关文件，导致 API 调用费用激增。
效率低下：为了回答一个简单的架构问题，Agent 可能需要发起数十次工具调用（Tool Calls），在成千上万个文件中寻找线索。
跨语言追踪断裂：在混合语言项目（如 iOS 中的 Swift/Obj-C，或 React Native 中的 JS/Native）中，静态分析往往止步于语言边界，导致调用链追踪中断。
实时性滞后：代码修改后，Agent 往往基于过时的索引或需要手动重新扫描，导致回答错误或延迟。

CodeGraph 通过预索引的知识图谱，让 Agent 从“盲目搜索”转变为“精准查询”，从而解决上述效率与成本问题。

核心功能

1. 语义知识图谱构建

CodeGraph 解析项目代码，构建包含符号关系、调用图和代码结构的本地索引（存储在 .codegraph/ 目录下）。Agent 不再需要扫描文件，而是直接查询图谱中的节点和边。

2. 多 Agent 自动集成

提供交互式安装器，自动检测并配置主流 AI 编程助手：

支持列表：Claude Code, Cursor, Codex CLI, opencode, Hermes Agent, Gemini CLI, Antigravity IDE, Kiro。
自动化配置：自动写入 MCP (Model Context Protocol) 服务器配置、使用指南和权限设置。
一键卸载：通过 codegraph uninstall 可逆向移除所有配置，清理痕迹。

3. 智能实时同步机制

CodeGraph 解决了“代码修改后索引滞后”的问题，通过三层机制确保数据新鲜度：

文件监听与防抖同步：利用原生 FSEvents (macOS)、inotify (Linux) 或 ReadDirectoryChangesW (Windows) 监听文件变更。默认 2000ms 防抖窗口将批量修改合并为单次同步。
文件过期提示：在防抖窗口期间，若查询涉及未同步文件，MCP 响应会附加 ⚠️ 警告，提示 Agent 直接读取文件以获取最新内容。
连接时捕获：MCP 服务器重连时，会立即对工作树进行快速校验（大小、修改时间、内容哈希），吸收之前的静默修改。

4. 跨语言桥接

针对混合语言项目，CodeGraph 能够跨越语言边界建立连接：

iOS：连接 Swift 调用与 Obj-C 选择器。
React Native：连接 JS 调用与 Native 模块。
元数据标记：所有跨语言边都标记有 provenance: 'heuristic' 和 synthesizedBy 字段，让 Agent 清楚知道连接来源的可靠性。

5. Web 框架路由感知

自动检测 Web 框架的路由文件，生成 route 节点，并将其与处理函数/类通过 references 边连接。这使得查询控制器调用者时，能直接返回绑定的 URL 模式。

亮点 / 与同类相比

性能与成本优势

根据在 7 个真实开源项目（涵盖 7 种语言）上的基准测试（使用 Claude Opus 4.8）：

成本降低 ~18%：显著减少输入 Token 消耗。
工具调用减少 ~57%：Agent 无需频繁调用 grep 或 Read。
速度提升 ~16%：直接查询图谱比扫描文件系统更快。
零文件读取：在大型仓库中，Agent 回答架构问题时可实现零文件读取。

架构差异

本地化与隐私

100% 本地运行：索引构建和查询均在本地完成，代码无需上传至云端。
无 Node.js 依赖：通过 curl 或 npx 即可运行，避免了版本冲突和编译问题。

适合谁用 / 上手

适合人群

大型代码库开发者：项目文件数超过数千，传统搜索效率低下的团队。
混合语言项目维护者：需要追踪跨语言调用链（如 iOS 混合开发、React Native）的工程师。
AI 编程助手重度用户：希望降低 Claude Code、Cursor 等工具 API 费用，并提高回答准确性的开发者。
注重隐私的企业团队：需要本地化处理代码结构，避免敏感代码外泄的场景。

快速上手指南

安装无需安装 Node.js，直接运行安装脚本：

# macOS / Linux
curl -fsSL https://raw.githubusercontent.com/colbymchenry/codegraph/main/install.sh | sh

# Windows (PowerShell)
irm https://raw.githubusercontent.com/colbymchenry/codegraph/main/install.ps1 | iex

或者使用 npm（如果已安装 Node）：

npx @colbymchenry/codegraph

初始化项目 进入项目目录，运行初始化命令。-i 参数表示同时构建初始索引：
```
cd your-project
codegraph init -i
```
此步骤会自动检测并配置你系统中已安装的 AI 助手（如 Cursor, Claude Code 等）。
日常使用
- 查询：在 AI 助手对话框中直接提问，CodeGraph 会在后台通过 MCP 协议提供结构化代码上下文。
- 状态检查：随时运行 codegraph status 查看索引同步状态。
- 手动同步：在脚本中或监听器禁用时，可运行 codegraph sync 强制更新索引。
卸载若不再使用，可彻底移除配置：
```
codegraph uninstall
```

查看原文 →github.com