Agent SkillLINUX DO · AI·1 小时前

开源推广 Kiyomizu：支持记忆与情感计算的 LLM 网关

原标题：【开源推广】Kiyomizu | 记忆化 LLM 网关

速览

Kiyomizu 是一款开源的 LLM 网关，旨在通过记忆化和情感计算增强 AI 交互体验。它支持 Claude 特化的缓存控制以提升性能，并利用 Embedding 技术实现基于向量相似度的记忆注入。此外，系统能评估对话的亲密度与信任度，使 AI 具备随交流成长的特性。

AI 深度解读

Kiyomizu：一个具备记忆与情感演化能力的开源 LLM 网关深度解读

背景

在当前的 AI 交互生态中，许多用户发现传统的角色扮演（RP）工具或“酒馆”类应用存在体验瓶颈。部分用户反映，过于极端的角色扮演设定容易触发模型的防御机制或导致对话中断，使得交互难以深入。与此同时，社交网络上存在大量专注于“人机恋”垂直领域的 LLM 网关解决方案，但这些方案往往通过特定社区（如 CC）进行微调或定制，导致功能过于特化，缺乏通用性。

在此背景下，开发者 Kiyomizu 试图打破这一局限。其核心理念源于对人际交往本质的观察——即通过“互相破甲”（建立信任与亲密感）来深化关系。开发者希望构建一个通用的 AI 伙伴网关，不仅支持通用的 LLM 接入，更赋予 AI 记忆能力和情感演化机制，使其能够像人类伙伴一样随着交流深入而“成长”。该项目由开发者利用个人 Token 资源及社区支持快速开发而成，旨在提供一个轻量级、可自定义且具备基础情感计算能力的开源解决方案。

核心内容

Kiyomizu 是一个基于 Java 开发的 Fat JAR 文件形式的 LLM 网关，其设计哲学遵循 “Write Once, Run Anywhere”（一次编写，到处运行）。它不仅仅是一个简单的 API 转发器，而是集成了缓存优化、记忆存储和情感计算功能的中间件。

1. 部署与基础架构

Kiyomizu 以 Fat JAR 形式分发，用户只需通过 java -jar xxx.jar 命令即可启动服务。默认监听端口为 8787。作为网关，它本身不直接提供对话界面，而是作为后端服务，用户需配置前端应用（如 Cherry Studio）将 API 接口指向 Kiyomizu 的地址，从而通过网关与底层 LLM 进行交互。

2. Claude 特化的缓存控制

针对 Anthropic 模型的缓存机制，Kiyomizu 提供了专门的优化功能。Anthropic 的模型缓存要求手动回传 cache_control 参数，且除了 Anthropic 第一方 Provider 支持自动缓存外，其他 Provider 需要手动标记四个缓存断点。Kiyomizu 实现了 Claude 特化模式，允许用户自定义 TTL（生存时间）、缓存分布策略以及断点数量，从而显著降低 API 调用成本并提升响应速度。

3. 记忆系统与向量检索

Kiyomizu 内置了一套简易的记忆系统，其工作流程如下：

摘要提取：通过摘要模型从对话中提取关键信息。
向量化：将提取的信息通过 Embedding 模型转换为向量。
相似度匹配：计算用户当前输入向量与数据库中记忆向量的余弦夹角，筛选出方向最一致的若干条记忆。
上下文注入：将匹配到的记忆注入到稳定前缀（Stable Prefix）之后，供模型参考。这一设计旨在提高缓存命中率（Cache Hit Rate）。

4. 情感演化机制

除了记忆，Kiyomizu 还引入了情感维度。每个对话结束后，系统会通过摘要模型评估出两个指标：亲密度（Intimacy）和信任度（Trust）。这两个数值会累加并存储至数据库中，使得 Kiyomizu 能够根据与用户的长期交互历史动态调整其状态，实现所谓的“成长”。出于隐私和用户体验考虑，系统未提供显式的亲密度查询接口，避免用户直接查看数据而破坏沉浸感。

5. 安全性与局限性

开发者明确承认 Kiyomizu 是一个“小玩具”级别的项目，开发周期仅为四五个小时，并与 Codex、Antigravity 等工具协作完成。项目存在潜在的安全风险，建议仅在 localhost 或局域网环境中部署测试。此外，目前的记忆功能仍带有一定的“人机感”，后续可能需要通过优化 System Prompt 来进一步驯化模型表现。

关键要点

通用性与易用性：提供 Fat JAR 包，通过 java -jar 一键启动，默认端口 8787，无需复杂的环境配置，降低了部署门槛。
Anthropic 缓存优化：专门解决了 Anthropic 模型在非第一方 Provider 下需要手动管理缓存断点的问题，支持自定义 TTL 和断点分布，有效节省 Token 消耗。
向量记忆注入：利用 Embedding 技术将对话摘要转化为向量，通过余弦相似度检索相关记忆，并将其注入到 Stable Prefix 之后，既实现了长期记忆，又优化了缓存效率。
情感数值演化：引入 Intimacy（亲密度）和 Trust（信任度）两个累加指标，基于摘要模型评估，使 AI 能够随交互时间推移产生状态变化，模拟人际关系的深化。
隐私保护设计：隐藏了亲密度和信任度的显式查询接口，防止用户直接查看底层数据，维护交互的自然感和隐私边界。
开源与实验性质：项目由个人开发者快速构建，代码质量和安全性未经过严格审计，官方建议仅用于本地或局域网实验，不建议在生产环境部署。
前端兼容：作为网关层，兼容各类支持自定义 API 的 LLM 客户端（如 Cherry Studio），用户可在前端配置指向 Kiyomizu 的地址即可使用其增强功能。

意义与影响

Kiyomizu 的出现反映了当前 AI 应用开发从“单次对话”向“长期关系”演进的趋势。它不仅仅是一个技术工具，更是对 AI 伴侣（AI Companion）领域的一种探索。

首先，它降低了个性化 AI 网关的开发门槛。通过封装复杂的缓存逻辑和记忆检索流程，Kiyomizu 让普通用户无需深入理解向量数据库或复杂的 Prompt 工程，即可拥有具备长期记忆和情感反馈的 AI 服务。这对于希望构建个性化 AI 助手的技术爱好者而言，提供了一个极佳的参考原型。

其次，它揭示了情感计算在 LLM 交互中的潜力。通过量化 Intimacy 和 Trust，Kiyomizu 尝试将抽象的人际关系转化为可计算的数值。虽然目前的实现较为粗糙，且依赖摘要模型的评估准确性，但这种机制为未来 AI 更好地理解用户偏好、建立更深层的情感连接提供了技术路径。

最后，它强调了开源社区在 AI 创新中的作用。该项目由个人开发者利用社区资源（如 Codex、Antigravity）快速迭代而成，体现了开源协作在加速 AI 应用落地方面的价值。尽管存在安全局限，但其开源性质鼓励了社区的共同改进，可能催生出更成熟、更安全的记忆化网关解决方案。对于关注 AI 记忆机制、缓存优化以及人机交互情感维度的开发者和研究者来说，Kiyomizu 提供了一个值得深入研究的开源案例。

查看原文 →linux.do