← 返回信息流
GitHub 热榜GitHub Trending · 日·4 天前

SuperMemory:面向AI时代的极速可扩展内存引擎与应用

原标题:supermemoryai/supermemory
TypeScript23,064 stars+236 今日

速览

SuperMemory是一个专为AI时代设计的内存引擎,具备极快的速度和强大的可扩展性。它作为AI时代的Memory API,支持大规模数据的高效处理,适用于需要长期记忆和复杂上下文管理的AI代理及智能体应用。

AI 深度解读

这是什么

Supermemory 是一个基于 TypeScript 构建的开源 AI 记忆与上下文引擎(Memory and Context Engine)。它旨在为 AI 应用提供持久化的记忆层,解决大语言模型(LLM)在对话间“失忆”的问题。

该项目在 GitHub 上拥有超过 23,000 颗 Star,并在 LongMemEval、LoCoMo 和 ConvoMem 三大主流 AI 记忆基准测试中均排名第一。Supermemory 不仅仅是一个简单的向量数据库,它被定位为公司的或个人 AI 的“大脑”,提供从事实提取、用户画像构建到知识更新和冲突处理的全栈上下文管理能力。

解决的问题

传统 AI 助手面临的核心痛点是上下文断裂状态丢失

  1. 对话间无记忆:LLM 默认是无状态的,每次新对话开始时,之前的交互历史、用户偏好和项目背景都会丢失。
  2. RAG 的局限性:传统的检索增强生成(RAG)仅基于文档片段检索,是“无状态”的,无法理解用户随时间变化的个人状态(例如:用户上周说住在纽约,这周搬到了旧金山,传统 RAG 可能仍返回纽约的信息)。
  3. 配置复杂:构建记忆系统通常需要自行搭建嵌入管道、向量数据库、分块策略以及复杂的去重和更新逻辑。

Supermemory 通过单一的结构化和本体论系统,自动处理这些复杂性,让 AI 能够像人类一样“记住”用户,并区分长期事实与短期上下文。

核心功能

Supermemory 提供了一套完整的上下文栈,主要包含以下核心模块:

  • 自动记忆提取与存储

    • 自动从对话中提取关键事实、偏好和项目背景。
    • 区分 static(长期静态事实,如职业、技术栈偏好)和 dynamic(动态近期上下文,如当前正在调试的问题)。
    • 支持按项目(Container Tags)隔离记忆,实现工作、个人、不同客户或代码库的上下文分离。
  • 智能用户画像(User Profiles)

    • 为每个用户自动生成并维护动态画像。
    • 单次 API 调用(约 50ms)即可返回用户画像及相关记忆,可直接注入 System Prompt 中,让 Agent 瞬间了解对话对象。
  • 混合搜索(Hybrid Search)

    • 将 RAG(文档检索)与 Memory(个人记忆)结合在单次查询中。
    • 既能检索外部知识库(如部署文档),又能召回用户的个人偏好(如部署方式偏好),实现更精准的上下文供给。
  • 自动遗忘与冲突解决

    • 自动过期:临时性信息(如“明天有考试”)在特定时间后自动失效,避免噪声污染长期记忆。
    • 冲突处理:自动识别并解决事实矛盾(例如用最新地址覆盖旧地址)。
  • 外部数据同步(Connectors)

    • 内置连接器支持 Google Drive、Gmail、Notion、OneDrive、GitHub 等平台的实时同步。
    • 支持文件处理(PDF、图片、视频、代码),自动进行分块和索引。
  • 多语言 SDK 与框架集成

    • 提供 npm install supermemory (TypeScript) 和 pip install supermemory (Python) 官方 SDK。
    • 提供 Vercel AI SDK、Mastra、LangChain、LangGraph、OpenAI Agents SDK 等主流框架的封装插件。

亮点 / 与同类相比

  • 基准测试领先:在 LongMemEval、LoCoMo 和 ConvoMem 三大权威基准测试中均位列第一,证明了其在记忆准确性和上下文理解上的 SOTA(State-of-the-art)水平。
  • Memory vs RAG 的清晰界定
    • 传统 RAG 是“无状态”的,对所有人返回相同结果。
    • Supermemory 强调“记忆”是对用户随时间变化的事实追踪。它默认同时运行 RAG 和 Memory,既提供知识库检索,又提供个性化上下文。
  • 开箱即用的 Agent 集成
    • 提供 Nova 内置 Agent。
    • 支持 MCP (Model Context Protocol) 协议,可无缝接入 Claude Desktop、Cursor、Windsurf、VS Code 等主流 AI 客户端。
    • 提供针对 Claude Code、OpenCode、OpenClaw 和 Hermes 的专用插件。
  • MemoryBench 基准框架
    • 项目开源了 MemoryBench 框架,允许开发者公平对比 Supermemory 与 Mem0、Zep 等竞品的表现。
  • 极简 API 设计
    • 开发者无需配置嵌入模型或向量数据库,通过简单的 client.add()client.profile() 即可完成记忆存储与检索。

适合谁用 / 上手

适合人群:

  • AI 应用开发者:希望为 Chatbot、Agent 或 Copilot 添加持久化记忆功能的工程师。
  • 个人用户:希望拥有能记住自己偏好、项目背景和个人知识的 AI 助手。
  • 企业团队:需要管理多用户、多项目上下文,并集成内部知识库(如 Notion、GitHub)的场景。

上手方式:

  1. 零代码使用(消费者版)

    • 直接访问 app.supermemory.ai 使用免费的应用程序。
    • 安装浏览器扩展或桌面应用,即可让任何兼容的 AI 助手获得记忆能力。
  2. 开发者集成(SDK/API)

    • 安装
      npm install supermemory
      # 或
      pip install supermemory
      
    • 基础代码示例 (TypeScript)
      import Supermemory from "supermemory";
      const client = new Supermemory();
      
      // 存储记忆
      await client.add({
        content: "User loves TypeScript and prefers functional patterns",
        containerTag: "user_123",
      });
      
      // 获取画像与相关记忆
      const { profile, searchResults } = await client.profile({
        containerTag: "user_123",
        q: "What programming style does the user prefer?",
      });
      
  3. 通过 MCP 协议接入客户端

    • 在 Claude Desktop、Cursor 等支持 MCP 的客户端配置中添加 Supermemory 服务器:
      {
        "mcpServers": {
          "supermemory": {
            "url": "https://mcp.supermemory.ai/mcp"
          }
        }
      }
      
    • 或使用 OAuth 安装:
      npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes
      
  4. 基准测试

    • 使用 MemoryBench 框架评估自身或竞品的记忆能力:
      bun run src/index.ts run -p supermemory -b longmemeval -j gpt-4o -r my-run
      

更多文档和快速入门指南请参考官方文档:supermemory.ai/docs

查看原文 →github.com