AI 资讯Hacker News·7 小时前

开源非营利项目：本地部署与30位历史人物对话

原标题：Show HN: Learn from 30 historical figures, open source, nonprofit, self-hosted

速览

这是一个开源且非营利的自托管项目，旨在让用户能够与30位历史人物进行互动。该项目通过本地部署方式运行，强调数据隐私与自主控制。它为用户提供了一种独特的学习体验，通过模拟历史人物的思维与对话来深化对历史的理解。

AI 深度解读

Show HN: 与30位历史人物对话的开源、非营利、可自托管项目解读

背景

在生成式人工智能迅速普及的当下，大多数AI产品往往伴随着数据收集、行为画像以及以用户参与度为导向的商业模型。然而，Hacker News 上近期出现了一个名为 Agora Cosmica 的项目，它反其道而行之，定位为“可对话的活体图书馆”（A Living Library You Can Talk To）。

该项目由德国非营利组织 ChipMates gemeinnützige GmbH 开发，旨在通过开源和自托管的方式，让用户能够与历史上30位著名人物进行基于研究的对话。其核心理念是“设计上的诚实”与“设计上的隐私保护”，强调无追踪Cookie、无用户画像，并将数据控制权交还给用户。这不仅是一个技术演示，更是一次关于伦理AI、教育科学应用以及非营利技术模式的实践。

核心内容

Agora Cosmica 允许用户与从马可·奥勒留（Marcus Aurelius）到阿达·洛芙莱斯（Ada Lovelace），从鲁米（Rumi）到弗里达·卡罗（Frida Kahlo）等30位历史人物互动。每位人物都拥有经过研究的独特声音和12条智慧教导。平台结合了数百个预录制的叙事片段、多角色对话以及实时的AI对话功能。

1. 交互模式与教育架构

每个交互都围绕一位特定人物展开，并遵循基于教育研究（如科尔布的经验学习循环、布鲁姆分类法、检索练习）设计的四章学习弧线：

Story（故事）：接收信息。
Wisdom（智慧）：探索内容。
Prism（棱镜）：建立联系。
Quest（探索）：验证所学。此外，还提供 Free Talk（自由交谈） 和 Council（圆桌会议） 两种开放式格式。

2. 内容规模与多语言支持

人物与教导：30位人物，每人12条教导，共360条智慧教导，涵盖2500年的人类思想。
素材库：包含360个故事、360个棱镜对话、110场四人圆桌辩论（55个问题，每个问题有两个深度层级），所有音频均与时间同步。
双语支持：所有内容、用户界面和音频均支持英语和德语。

3. 隐私与数据保护机制

项目强调“设计上的隐私”（Privacy by design）：

无账号限制：免费层级无需注册，每天提供30条消息，通过 Cloudflare Worker 运行。
无行为追踪：不收集追踪Cookie、无第三方分析、无请求级别的访问日志、不保留IP地址用于分析、不建立跨会话画像。仅收集匿名聚合计数器以维持服务运行。
BYOK加密：用户可自带 OpenRouter 密钥，密钥在本地通过 AES-256-GCM 加密，绝不存储在服务器端。
数据本地化：实时语音合成（TTS）和语音识别（STT）运行位于德国的自有GPU服务器上；预录制音频存储在欧盟（西欧）的 Cloudflare R2 上。

4. 技术架构与自托管能力

开源许可：代码采用 AGPL-3.0 许可，内容在发布初期版权归 ChipMates 所有，计划在6-12个月内过渡为 CC-BY 4.0 许可。
本地部署：用户可通过 docker compose up 快速自托管。
Local Mode：v1.1.1 版本支持将应用指向任何兼容 OpenAI 的 LLM 端点（如 LM Studio, Ollama, vLLM），并在本地运行音频堆栈（Kokoro EN, Qwen3-TTS DE, Whisper STT）。在此模式下，所有对话、语音和文本数据均不出本地机器。
后端推理：免费层级使用位于芬兰 Nebius 的 Qwen3 235B 模型进行推理。

5. 伦理声明与透明度

AI Echo 框架：明确声明每位人物均为“AI Echo”（AI渲染的演绎），绝非真实录音或代表本人发言。
事实核查：每位人物页面均列出历史验证内容与叙事重构内容的区别。
透明度：通过阅读代码可验证隐私和架构声明。

6. 合规性与无障碍

合规：符合 GDPR、欧盟《人工智能法案》第50条以及德国《青少年媒体保护条例》（JMStV）。
无障碍：符合 WCAG 2.2 AA 标准，支持键盘导航、屏幕阅读器，触摸目标大小为44px。
安全：多层内容筛选、危机资源链接、越狱检测及PII（个人身份信息）保护。

7. 关于 Google Click ID (gclid) 的特别说明

项目方主动回应了关于数据隐私的质疑：如果用户通过 Google 广告访问并选择加入，服务器端会将 Google 点击 ID (gclid) 转发给 Google Ads 以匹配转化数据。这被视为个人数据，但仅服务器端转发，且不将其与自有分析数据关联。其他所有用户或拒绝加入的用户，均不会向 Google 发送任何数据。

关键要点

非营利驱动：由德国非营利组织 ChipMates 运营，使命是普及智慧，而非追求投资者回报或用户参与度最大化。
完全开源与自托管：代码 AGPL-3.0 开源，支持 Docker 一键部署，允许用户完全掌控数据流。
隐私优先设计：
- 无注册门槛（每日30条免费消息）。
- 无行为追踪、无画像、无IP留存。
- 支持 BYOK（自带密钥）并本地加密。
- 实时语音处理在德国自有服务器完成，音频数据存储在欧盟。
教育科学基础：对话结构基于科尔布学习循环和布鲁姆分类法，旨在提供结构化的学习体验，而非简单的闲聊。
技术栈亮点：
- 使用 Qwen3 235B 作为主要推理模型。
- 音频技术包括 Kokoro (EN), Qwen3-TTS (DE), F5 (DE), Faster-Whisper。
- 支持本地模式，实现数据不出本地。
伦理透明：明确区分“AI演绎”与“历史事实”，提供详细的事实核查清单。
社区参与：非技术人员可通过应用内的社区面板投票决定新增人物，开发者可贡献代码、翻译或修复Bug。

意义与影响

Agora Cosmica 的出现为 AI 行业提供了另一种可能性：AI 产品可以不依赖数据剥削和成瘾性设计，而是通过透明度、用户赋权和教育价值来建立信任。

重新定义 AI 伦理：通过“AI Echo”的明确框架和事实核查机制，该项目展示了如何在利用大语言模型进行角色扮演时，保持对历史真实性的尊重和对用户的诚实。
隐私保护的标杆：在普遍存在数据收集的行业背景下，其“无追踪、无画像、本地加密、欧盟托管”的技术架构，为注重隐私的用户和教育机构提供了一个可信的替代方案。特别是其主动公开 gclid 处理逻辑的做法，体现了极高的透明度。
教育科技的创新：将 AI 对话与经过验证的教育心理学框架（如检索练习、经验学习循环）相结合，使得 AI 不仅是聊天工具，更成为结构化的学习伴侣。
非营利开源模式的示范：证明了非营利组织可以通过开源项目和技术服务，在不牺牲隐私和伦理的前提下，提供高质量的人工智能应用。其从私有版权向 CC-BY 4.0 过渡的计划，也体现了促进知识共享的承诺。

对于开发者、教育工作者和隐私倡导者而言，Agora Cosmica 不仅是一个可体验的应用，更是一个值得审计和学习的代码库，展示了如何在工程实践中贯彻“隐私

查看原文 →github.com