← 返回信息流
GitHub 热榜GitHub Trending · 日·1 小时前

Cognee:面向AI Agent的开源持久化记忆平台

原标题:topoteretes/cognee
Python18,422 stars+361 今日

速览

Cognee是一个自托管的知识图谱引擎,允许开发者将长期记忆集成到AI Agent中,实现跨会话的知识持久化与检索。它通过构建动态知识图谱,增强了Agent在复杂任务中的上下文理解与记忆保持能力,特别适用于需要长期交互和知识积累的智能体应用。

AI 深度解读

这是什么

Cognee 是一个开源的 AI 记忆平台(AI Memory Platform),旨在为 AI Agent(智能体)提供跨会话的持久化长期记忆能力。它允许开发者将任意格式的数据摄入系统,构建自托管的知识图谱(Knowledge Graph),使 AI 能够基于完整上下文进行回忆、关联和操作。

Cognee 的核心设计理念是将向量嵌入(Vector Embeddings)、图推理(Graph Reasoning)以及基于认知科学的本体生成(Ontology Generation)相结合。这不仅让文档可以通过语义进行检索,还能通过不断演进的实体关系将知识连接起来,从而解决大语言模型(LLM)固有的“上下文窗口限制”和“遗忘”问题。

该项目由 topoteretes 维护,主语言为 Python,在 GitHub 上已获得超过 18,000 星。它支持本地部署以及通过 Cognee Cloud 进行托管服务。

解决的问题

传统 AI 应用面临以下核心痛点,Cognee 试图从架构层面解决:

  1. 缺乏长期记忆:LLM 本身是无状态的,每次交互都依赖当前的 Prompt 上下文。一旦上下文窗口耗尽或会话结束,之前的对话细节、用户偏好和历史事实就会丢失。
  2. 数据孤岛与碎片化:企业数据分散在数据库、文档、聊天记录等多种来源中,难以形成统一的知识视图供 Agent 调用。
  3. 检索增强生成(RAG)的局限性:传统的 RAG 仅基于向量相似度检索,容易丢失实体间的复杂关系(如“谁在什么时间对谁做了什么”),导致推理能力不足。
  4. 信任与可追溯性缺失:在企业级应用中,Agent 的决策过程需要可审计,且不同租户/用户的数据必须严格隔离,防止数据泄露。

核心功能

Cognee 提供了一套完整的记忆管理生命周期,主要包含以下四个核心 API 操作:

  • Remember(记忆)
    • 永久记忆:将数据摄入并构建到知识图谱中(执行 add -> cognify -> improve 流程)。
    • 会话记忆:快速缓存当前会话的数据,并在后台异步同步到永久图谱中。
  • Recall(回忆)
    • 自动路由检索:系统自动选择最佳的搜索策略(向量搜索或图遍历)来回答查询。
    • 混合检索:支持先查询会话记忆,若未命中则回退到永久知识图谱。
  • Forget(遗忘)
    • 提供数据删除机制,支持按数据集或特定 ID 清理记忆,满足隐私合规要求。
  • Improve(优化)
    • 通过反馈循环优化知识图谱的结构和检索效果,使 Agent 能够从错误中学习并更新记忆。

技术架构亮点:

  • 自托管知识图谱:不依赖外部专有图谱服务,支持本地运行。
  • 多模态摄入:支持多种数据格式的自动解析和结构化。
  • OTEL 集成:内置 OpenTelemetry 支持,提供完整的可观测性和审计轨迹。
  • 租户隔离:支持 Agentic User/Tenant Isolation,确保多租户环境下的数据安全。

亮点 / 与同类相比

与 LangChain、LlamaIndex 等通用 RAG 框架相比,Cognee 的独特优势在于其**“记忆优先”“图谱增强”**的定位:

  1. 从 RAG 到 Memory Graph
    • 传统 RAG 框架侧重于“检索-生成”管道,而 Cognee 侧重于构建一个动态演进的知识图谱。它不仅存储文档片段,还显式地建模实体之间的关系,使得 Agent 具备更强的复杂推理能力。
  2. 认知科学驱动的本体生成
    • Cognee 引入了基于认知科学的本体生成技术,这意味着它不仅仅是提取关键词,而是尝试理解数据背后的概念结构,使知识表示更符合人类认知逻辑。
  3. 无缝的 Agent 集成生态
    • 提供了针对主流 Agent 框架的插件,如 OpenClawClaude Code。例如,Claude Code 插件可以自动捕获工具调用(Tool Calls)并同步到永久记忆,实现了“越用越聪明”的效果。
  4. 开箱即用的 UI 与 CLI
    • 提供 cognee-cli 命令行工具和本地 Web UI,方便开发者快速测试和可视化知识图谱的构建过程。
  5. 研究背书
    • 基于 2025 年发表的研究论文《Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning》,在知识图谱与大模型接口的优化上有学术支撑。

适合谁用 / 上手

适合人群:

  • AI Agent 开发者:需要为 Agent 添加长期记忆、上下文管理和跨会话学习能力的团队。
  • 企业级应用构建者:需要构建“公司大脑”(Company Brain),统一内部数据源,并确保数据隐私和审计合规的企业。
  • RAG 进阶用户:发现传统向量检索在复杂关系推理上存在瓶颈,希望引入图数据库能力的开发者。

快速上手指南:

  1. 环境要求:Python 3.10 - 3.14。
  2. 安装
    uv pip install cognee
    # 或
    pip install cognee
    
  3. 配置:设置 LLM API Key(如 OpenAI):
    export LLM_API_KEY="YOUR_OPENAI_API_KEY"
    
  4. 代码示例
    import cognee
    import asyncio
    
    async def main():
        # 存入永久记忆
        await cognee.remember("Cognee turns documents into AI memory.")
        
        # 查询记忆
        results = await cognee.recall("What does Cognee do?")
        for result in results:
            print(result)
    
    asyncio.run(main())
    
  5. 进阶部署
    • 本地 UI:运行 cognee-cli -ui 启动本地界面(需 Docker 环境)。
    • 云端服务:通过 cognee.serve(url="...", api_key="...") 连接 Cognee Cloud。
    • 插件集成:克隆 cognee-integrations 仓库并配置以支持 Claude Code 等工具。

Cognee 提供了一个从数据摄入、图谱构建到记忆检索的完整闭环,是构建下一代具备“记忆”能力的 AI Agent 的基础设施。

查看原文 →github.com