Cognee:面向AI Agent的开源持久化记忆平台
速览
Cognee是一个自托管的知识图谱引擎,允许开发者将长期记忆集成到AI Agent中,实现跨会话的知识持久化与检索。它通过构建动态知识图谱,增强了Agent在复杂任务中的上下文理解与记忆保持能力,特别适用于需要长期交互和知识积累的智能体应用。
AI 深度解读
这是什么
Cognee 是一个开源的 AI 记忆平台(AI Memory Platform),旨在为 AI Agent(智能体)提供跨会话的持久化长期记忆能力。它允许开发者将任意格式的数据摄入系统,构建自托管的知识图谱(Knowledge Graph),使 AI 能够基于完整上下文进行回忆、关联和操作。
Cognee 的核心设计理念是将向量嵌入(Vector Embeddings)、图推理(Graph Reasoning)以及基于认知科学的本体生成(Ontology Generation)相结合。这不仅让文档可以通过语义进行检索,还能通过不断演进的实体关系将知识连接起来,从而解决大语言模型(LLM)固有的“上下文窗口限制”和“遗忘”问题。
该项目由 topoteretes 维护,主语言为 Python,在 GitHub 上已获得超过 18,000 星。它支持本地部署以及通过 Cognee Cloud 进行托管服务。
解决的问题
传统 AI 应用面临以下核心痛点,Cognee 试图从架构层面解决:
- 缺乏长期记忆:LLM 本身是无状态的,每次交互都依赖当前的 Prompt 上下文。一旦上下文窗口耗尽或会话结束,之前的对话细节、用户偏好和历史事实就会丢失。
- 数据孤岛与碎片化:企业数据分散在数据库、文档、聊天记录等多种来源中,难以形成统一的知识视图供 Agent 调用。
- 检索增强生成(RAG)的局限性:传统的 RAG 仅基于向量相似度检索,容易丢失实体间的复杂关系(如“谁在什么时间对谁做了什么”),导致推理能力不足。
- 信任与可追溯性缺失:在企业级应用中,Agent 的决策过程需要可审计,且不同租户/用户的数据必须严格隔离,防止数据泄露。
核心功能
Cognee 提供了一套完整的记忆管理生命周期,主要包含以下四个核心 API 操作:
- Remember(记忆):
- 永久记忆:将数据摄入并构建到知识图谱中(执行
add->cognify->improve流程)。 - 会话记忆:快速缓存当前会话的数据,并在后台异步同步到永久图谱中。
- 永久记忆:将数据摄入并构建到知识图谱中(执行
- Recall(回忆):
- 自动路由检索:系统自动选择最佳的搜索策略(向量搜索或图遍历)来回答查询。
- 混合检索:支持先查询会话记忆,若未命中则回退到永久知识图谱。
- Forget(遗忘):
- 提供数据删除机制,支持按数据集或特定 ID 清理记忆,满足隐私合规要求。
- Improve(优化):
- 通过反馈循环优化知识图谱的结构和检索效果,使 Agent 能够从错误中学习并更新记忆。
技术架构亮点:
- 自托管知识图谱:不依赖外部专有图谱服务,支持本地运行。
- 多模态摄入:支持多种数据格式的自动解析和结构化。
- OTEL 集成:内置 OpenTelemetry 支持,提供完整的可观测性和审计轨迹。
- 租户隔离:支持 Agentic User/Tenant Isolation,确保多租户环境下的数据安全。
亮点 / 与同类相比
与 LangChain、LlamaIndex 等通用 RAG 框架相比,Cognee 的独特优势在于其**“记忆优先”和“图谱增强”**的定位:
- 从 RAG 到 Memory Graph:
- 传统 RAG 框架侧重于“检索-生成”管道,而 Cognee 侧重于构建一个动态演进的知识图谱。它不仅存储文档片段,还显式地建模实体之间的关系,使得 Agent 具备更强的复杂推理能力。
- 认知科学驱动的本体生成:
- Cognee 引入了基于认知科学的本体生成技术,这意味着它不仅仅是提取关键词,而是尝试理解数据背后的概念结构,使知识表示更符合人类认知逻辑。
- 无缝的 Agent 集成生态:
- 提供了针对主流 Agent 框架的插件,如 OpenClaw 和 Claude Code。例如,Claude Code 插件可以自动捕获工具调用(Tool Calls)并同步到永久记忆,实现了“越用越聪明”的效果。
- 开箱即用的 UI 与 CLI:
- 提供
cognee-cli命令行工具和本地 Web UI,方便开发者快速测试和可视化知识图谱的构建过程。
- 提供
- 研究背书:
- 基于 2025 年发表的研究论文《Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning》,在知识图谱与大模型接口的优化上有学术支撑。
适合谁用 / 上手
适合人群:
- AI Agent 开发者:需要为 Agent 添加长期记忆、上下文管理和跨会话学习能力的团队。
- 企业级应用构建者:需要构建“公司大脑”(Company Brain),统一内部数据源,并确保数据隐私和审计合规的企业。
- RAG 进阶用户:发现传统向量检索在复杂关系推理上存在瓶颈,希望引入图数据库能力的开发者。
快速上手指南:
- 环境要求:Python 3.10 - 3.14。
- 安装:
uv pip install cognee # 或 pip install cognee - 配置:设置 LLM API Key(如 OpenAI):
export LLM_API_KEY="YOUR_OPENAI_API_KEY" - 代码示例:
import cognee import asyncio async def main(): # 存入永久记忆 await cognee.remember("Cognee turns documents into AI memory.") # 查询记忆 results = await cognee.recall("What does Cognee do?") for result in results: print(result) asyncio.run(main()) - 进阶部署:
- 本地 UI:运行
cognee-cli -ui启动本地界面(需 Docker 环境)。 - 云端服务:通过
cognee.serve(url="...", api_key="...")连接 Cognee Cloud。 - 插件集成:克隆
cognee-integrations仓库并配置以支持 Claude Code 等工具。
- 本地 UI:运行
Cognee 提供了一个从数据摄入、图谱构建到记忆检索的完整闭环,是构建下一代具备“记忆”能力的 AI Agent 的基础设施。
