开源非营利项目:本地部署与30位历史人物对话
速览
这是一个开源且非营利的自托管项目,旨在让用户能够与30位历史人物进行互动。该项目通过本地部署方式运行,强调数据隐私与自主控制。它为用户提供了一种独特的学习体验,通过模拟历史人物的思维与对话来深化对历史的理解。
AI 深度解读
Show HN: 与30位历史人物对话的开源、非营利、可自托管项目解读
背景
在生成式人工智能迅速普及的当下,大多数AI产品往往伴随着数据收集、行为画像以及以用户参与度为导向的商业模型。然而,Hacker News 上近期出现了一个名为 Agora Cosmica 的项目,它反其道而行之,定位为“可对话的活体图书馆”(A Living Library You Can Talk To)。
该项目由德国非营利组织 ChipMates gemeinnützige GmbH 开发,旨在通过开源和自托管的方式,让用户能够与历史上30位著名人物进行基于研究的对话。其核心理念是“设计上的诚实”与“设计上的隐私保护”,强调无追踪Cookie、无用户画像,并将数据控制权交还给用户。这不仅是一个技术演示,更是一次关于伦理AI、教育科学应用以及非营利技术模式的实践。
核心内容
Agora Cosmica 允许用户与从马可·奥勒留(Marcus Aurelius)到阿达·洛芙莱斯(Ada Lovelace),从鲁米(Rumi)到弗里达·卡罗(Frida Kahlo)等30位历史人物互动。每位人物都拥有经过研究的独特声音和12条智慧教导。平台结合了数百个预录制的叙事片段、多角色对话以及实时的AI对话功能。
1. 交互模式与教育架构
每个交互都围绕一位特定人物展开,并遵循基于教育研究(如科尔布的经验学习循环、布鲁姆分类法、检索练习)设计的四章学习弧线:
- Story(故事):接收信息。
- Wisdom(智慧):探索内容。
- Prism(棱镜):建立联系。
- Quest(探索):验证所学。 此外,还提供 Free Talk(自由交谈) 和 Council(圆桌会议) 两种开放式格式。
2. 内容规模与多语言支持
- 人物与教导:30位人物,每人12条教导,共360条智慧教导,涵盖2500年的人类思想。
- 素材库:包含360个故事、360个棱镜对话、110场四人圆桌辩论(55个问题,每个问题有两个深度层级),所有音频均与时间同步。
- 双语支持:所有内容、用户界面和音频均支持英语和德语。
3. 隐私与数据保护机制
项目强调“设计上的隐私”(Privacy by design):
- 无账号限制:免费层级无需注册,每天提供30条消息,通过 Cloudflare Worker 运行。
- 无行为追踪:不收集追踪Cookie、无第三方分析、无请求级别的访问日志、不保留IP地址用于分析、不建立跨会话画像。仅收集匿名聚合计数器以维持服务运行。
- BYOK加密:用户可自带 OpenRouter 密钥,密钥在本地通过 AES-256-GCM 加密,绝不存储在服务器端。
- 数据本地化:实时语音合成(TTS)和语音识别(STT)运行位于德国的自有GPU服务器上;预录制音频存储在欧盟(西欧)的 Cloudflare R2 上。
4. 技术架构与自托管能力
- 开源许可:代码采用 AGPL-3.0 许可,内容在发布初期版权归 ChipMates 所有,计划在6-12个月内过渡为 CC-BY 4.0 许可。
- 本地部署:用户可通过
docker compose up快速自托管。 - Local Mode:v1.1.1 版本支持将应用指向任何兼容 OpenAI 的 LLM 端点(如 LM Studio, Ollama, vLLM),并在本地运行音频堆栈(Kokoro EN, Qwen3-TTS DE, Whisper STT)。在此模式下,所有对话、语音和文本数据均不出本地机器。
- 后端推理:免费层级使用位于芬兰 Nebius 的 Qwen3 235B 模型进行推理。
5. 伦理声明与透明度
- AI Echo 框架:明确声明每位人物均为“AI Echo”(AI渲染的演绎),绝非真实录音或代表本人发言。
- 事实核查:每位人物页面均列出历史验证内容与叙事重构内容的区别。
- 透明度:通过阅读代码可验证隐私和架构声明。
6. 合规性与无障碍
- 合规:符合 GDPR、欧盟《人工智能法案》第50条以及德国《青少年媒体保护条例》(JMStV)。
- 无障碍:符合 WCAG 2.2 AA 标准,支持键盘导航、屏幕阅读器,触摸目标大小为44px。
- 安全:多层内容筛选、危机资源链接、越狱检测及PII(个人身份信息)保护。
7. 关于 Google Click ID (gclid) 的特别说明
项目方主动回应了关于数据隐私的质疑:如果用户通过 Google 广告访问并选择加入,服务器端会将 Google 点击 ID (gclid) 转发给 Google Ads 以匹配转化数据。这被视为个人数据,但仅服务器端转发,且不将其与自有分析数据关联。其他所有用户或拒绝加入的用户,均不会向 Google 发送任何数据。
关键要点
- 非营利驱动:由德国非营利组织 ChipMates 运营,使命是普及智慧,而非追求投资者回报或用户参与度最大化。
- 完全开源与自托管:代码 AGPL-3.0 开源,支持 Docker 一键部署,允许用户完全掌控数据流。
- 隐私优先设计:
- 无注册门槛(每日30条免费消息)。
- 无行为追踪、无画像、无IP留存。
- 支持 BYOK(自带密钥)并本地加密。
- 实时语音处理在德国自有服务器完成,音频数据存储在欧盟。
- 教育科学基础:对话结构基于科尔布学习循环和布鲁姆分类法,旨在提供结构化的学习体验,而非简单的闲聊。
- 技术栈亮点:
- 使用 Qwen3 235B 作为主要推理模型。
- 音频技术包括 Kokoro (EN), Qwen3-TTS (DE), F5 (DE), Faster-Whisper。
- 支持本地模式,实现数据不出本地。
- 伦理透明:明确区分“AI演绎”与“历史事实”,提供详细的事实核查清单。
- 社区参与:非技术人员可通过应用内的社区面板投票决定新增人物,开发者可贡献代码、翻译或修复Bug。
意义与影响
Agora Cosmica 的出现为 AI 行业提供了另一种可能性:AI 产品可以不依赖数据剥削和成瘾性设计,而是通过透明度、用户赋权和教育价值来建立信任。
- 重新定义 AI 伦理:通过“AI Echo”的明确框架和事实核查机制,该项目展示了如何在利用大语言模型进行角色扮演时,保持对历史真实性的尊重和对用户的诚实。
- 隐私保护的标杆:在普遍存在数据收集的行业背景下,其“无追踪、无画像、本地加密、欧盟托管”的技术架构,为注重隐私的用户和教育机构提供了一个可信的替代方案。特别是其主动公开 gclid 处理逻辑的做法,体现了极高的透明度。
- 教育科技的创新:将 AI 对话与经过验证的教育心理学框架(如检索练习、经验学习循环)相结合,使得 AI 不仅是聊天工具,更成为结构化的学习伴侣。
- 非营利开源模式的示范:证明了非营利组织可以通过开源项目和技术服务,在不牺牲隐私和伦理的前提下,提供高质量的人工智能应用。其从私有版权向 CC-BY 4.0 过渡的计划,也体现了促进知识共享的承诺。
对于开发者、教育工作者和隐私倡导者而言,Agora Cosmica 不仅是一个可体验的应用,更是一个值得审计和学习的代码库,展示了如何在工程实践中贯彻“隐私
