GitHub 热榜GitHub Trending · 日·1 小时前

Cognee：面向AI Agent的开源持久化记忆平台

原标题：topoteretes/cognee

Python★ 18,422 stars+361 今日

速览

Cognee是一个自托管的知识图谱引擎，允许开发者将长期记忆集成到AI Agent中，实现跨会话的知识持久化与检索。它通过构建动态知识图谱，增强了Agent在复杂任务中的上下文理解与记忆保持能力，特别适用于需要长期交互和知识积累的智能体应用。

AI 深度解读

这是什么

Cognee 是一个开源的 AI 记忆平台（AI Memory Platform），旨在为 AI Agent（智能体）提供跨会话的持久化长期记忆能力。它允许开发者将任意格式的数据摄入系统，构建自托管的知识图谱（Knowledge Graph），使 AI 能够基于完整上下文进行回忆、关联和操作。

Cognee 的核心设计理念是将向量嵌入（Vector Embeddings）、图推理（Graph Reasoning）以及基于认知科学的本体生成（Ontology Generation）相结合。这不仅让文档可以通过语义进行检索，还能通过不断演进的实体关系将知识连接起来，从而解决大语言模型（LLM）固有的“上下文窗口限制”和“遗忘”问题。

该项目由 topoteretes 维护，主语言为 Python，在 GitHub 上已获得超过 18,000 星。它支持本地部署以及通过 Cognee Cloud 进行托管服务。

解决的问题

传统 AI 应用面临以下核心痛点，Cognee 试图从架构层面解决：

缺乏长期记忆：LLM 本身是无状态的，每次交互都依赖当前的 Prompt 上下文。一旦上下文窗口耗尽或会话结束，之前的对话细节、用户偏好和历史事实就会丢失。
数据孤岛与碎片化：企业数据分散在数据库、文档、聊天记录等多种来源中，难以形成统一的知识视图供 Agent 调用。
检索增强生成（RAG）的局限性：传统的 RAG 仅基于向量相似度检索，容易丢失实体间的复杂关系（如“谁在什么时间对谁做了什么”），导致推理能力不足。
信任与可追溯性缺失：在企业级应用中，Agent 的决策过程需要可审计，且不同租户/用户的数据必须严格隔离，防止数据泄露。

核心功能

Cognee 提供了一套完整的记忆管理生命周期，主要包含以下四个核心 API 操作：

Remember（记忆）：
- 永久记忆：将数据摄入并构建到知识图谱中（执行 add -> cognify -> improve 流程）。
- 会话记忆：快速缓存当前会话的数据，并在后台异步同步到永久图谱中。
Recall（回忆）：
- 自动路由检索：系统自动选择最佳的搜索策略（向量搜索或图遍历）来回答查询。
- 混合检索：支持先查询会话记忆，若未命中则回退到永久知识图谱。
Forget（遗忘）：
- 提供数据删除机制，支持按数据集或特定 ID 清理记忆，满足隐私合规要求。
Improve（优化）：
- 通过反馈循环优化知识图谱的结构和检索效果，使 Agent 能够从错误中学习并更新记忆。

技术架构亮点：

自托管知识图谱：不依赖外部专有图谱服务，支持本地运行。
多模态摄入：支持多种数据格式的自动解析和结构化。
OTEL 集成：内置 OpenTelemetry 支持，提供完整的可观测性和审计轨迹。
租户隔离：支持 Agentic User/Tenant Isolation，确保多租户环境下的数据安全。

亮点 / 与同类相比

与 LangChain、LlamaIndex 等通用 RAG 框架相比，Cognee 的独特优势在于其**“记忆优先”和“图谱增强”**的定位：

从 RAG 到 Memory Graph：
- 传统 RAG 框架侧重于“检索-生成”管道，而 Cognee 侧重于构建一个动态演进的知识图谱。它不仅存储文档片段，还显式地建模实体之间的关系，使得 Agent 具备更强的复杂推理能力。
认知科学驱动的本体生成：
- Cognee 引入了基于认知科学的本体生成技术，这意味着它不仅仅是提取关键词，而是尝试理解数据背后的概念结构，使知识表示更符合人类认知逻辑。
无缝的 Agent 集成生态：
- 提供了针对主流 Agent 框架的插件，如 OpenClaw 和 Claude Code。例如，Claude Code 插件可以自动捕获工具调用（Tool Calls）并同步到永久记忆，实现了“越用越聪明”的效果。
开箱即用的 UI 与 CLI：
- 提供 cognee-cli 命令行工具和本地 Web UI，方便开发者快速测试和可视化知识图谱的构建过程。
研究背书：
- 基于 2025 年发表的研究论文《Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning》，在知识图谱与大模型接口的优化上有学术支撑。

适合谁用 / 上手

适合人群：

AI Agent 开发者：需要为 Agent 添加长期记忆、上下文管理和跨会话学习能力的团队。
企业级应用构建者：需要构建“公司大脑”（Company Brain），统一内部数据源，并确保数据隐私和审计合规的企业。
RAG 进阶用户：发现传统向量检索在复杂关系推理上存在瓶颈，希望引入图数据库能力的开发者。

快速上手指南：

环境要求：Python 3.10 - 3.14。

安装：

uv pip install cognee
# 或
pip install cognee

配置：设置 LLM API Key（如 OpenAI）：
```
export LLM_API_KEY="YOUR_OPENAI_API_KEY"
```

代码示例：

import cognee
import asyncio

async def main():
    # 存入永久记忆
    await cognee.remember("Cognee turns documents into AI memory.")
    
    # 查询记忆
    results = await cognee.recall("What does Cognee do?")
    for result in results:
        print(result)

asyncio.run(main())

进阶部署：
- 本地 UI：运行 cognee-cli -ui 启动本地界面（需 Docker 环境）。
- 云端服务：通过 cognee.serve(url="...", api_key="...") 连接 Cognee Cloud。
- 插件集成：克隆 cognee-integrations 仓库并配置以支持 Claude Code 等工具。

Cognee 提供了一个从数据摄入、图谱构建到记忆检索的完整闭环，是构建下一代具备“记忆”能力的 AI Agent 的基础设施。

查看原文 →github.com