← 返回信息流
AI 资讯Hacker News·7 小时前

开源非营利项目:本地部署与30位历史人物对话

原标题:Show HN: Learn from 30 historical figures, open source, nonprofit, self-hosted

速览

这是一个开源且非营利的自托管项目,旨在让用户能够与30位历史人物进行互动。该项目通过本地部署方式运行,强调数据隐私与自主控制。它为用户提供了一种独特的学习体验,通过模拟历史人物的思维与对话来深化对历史的理解。

AI 深度解读

Show HN: 与30位历史人物对话的开源、非营利、可自托管项目解读

背景

在生成式人工智能迅速普及的当下,大多数AI产品往往伴随着数据收集、行为画像以及以用户参与度为导向的商业模型。然而,Hacker News 上近期出现了一个名为 Agora Cosmica 的项目,它反其道而行之,定位为“可对话的活体图书馆”(A Living Library You Can Talk To)。

该项目由德国非营利组织 ChipMates gemeinnützige GmbH 开发,旨在通过开源和自托管的方式,让用户能够与历史上30位著名人物进行基于研究的对话。其核心理念是“设计上的诚实”与“设计上的隐私保护”,强调无追踪Cookie、无用户画像,并将数据控制权交还给用户。这不仅是一个技术演示,更是一次关于伦理AI、教育科学应用以及非营利技术模式的实践。

核心内容

Agora Cosmica 允许用户与从马可·奥勒留(Marcus Aurelius)到阿达·洛芙莱斯(Ada Lovelace),从鲁米(Rumi)到弗里达·卡罗(Frida Kahlo)等30位历史人物互动。每位人物都拥有经过研究的独特声音和12条智慧教导。平台结合了数百个预录制的叙事片段、多角色对话以及实时的AI对话功能。

1. 交互模式与教育架构

每个交互都围绕一位特定人物展开,并遵循基于教育研究(如科尔布的经验学习循环、布鲁姆分类法、检索练习)设计的四章学习弧线:

  • Story(故事):接收信息。
  • Wisdom(智慧):探索内容。
  • Prism(棱镜):建立联系。
  • Quest(探索):验证所学。 此外,还提供 Free Talk(自由交谈)Council(圆桌会议) 两种开放式格式。

2. 内容规模与多语言支持

  • 人物与教导:30位人物,每人12条教导,共360条智慧教导,涵盖2500年的人类思想。
  • 素材库:包含360个故事、360个棱镜对话、110场四人圆桌辩论(55个问题,每个问题有两个深度层级),所有音频均与时间同步。
  • 双语支持:所有内容、用户界面和音频均支持英语和德语。

3. 隐私与数据保护机制

项目强调“设计上的隐私”(Privacy by design):

  • 无账号限制:免费层级无需注册,每天提供30条消息,通过 Cloudflare Worker 运行。
  • 无行为追踪:不收集追踪Cookie、无第三方分析、无请求级别的访问日志、不保留IP地址用于分析、不建立跨会话画像。仅收集匿名聚合计数器以维持服务运行。
  • BYOK加密:用户可自带 OpenRouter 密钥,密钥在本地通过 AES-256-GCM 加密,绝不存储在服务器端。
  • 数据本地化:实时语音合成(TTS)和语音识别(STT)运行位于德国的自有GPU服务器上;预录制音频存储在欧盟(西欧)的 Cloudflare R2 上。

4. 技术架构与自托管能力

  • 开源许可:代码采用 AGPL-3.0 许可,内容在发布初期版权归 ChipMates 所有,计划在6-12个月内过渡为 CC-BY 4.0 许可。
  • 本地部署:用户可通过 docker compose up 快速自托管。
  • Local Mode:v1.1.1 版本支持将应用指向任何兼容 OpenAI 的 LLM 端点(如 LM Studio, Ollama, vLLM),并在本地运行音频堆栈(Kokoro EN, Qwen3-TTS DE, Whisper STT)。在此模式下,所有对话、语音和文本数据均不出本地机器。
  • 后端推理:免费层级使用位于芬兰 Nebius 的 Qwen3 235B 模型进行推理。

5. 伦理声明与透明度

  • AI Echo 框架:明确声明每位人物均为“AI Echo”(AI渲染的演绎),绝非真实录音或代表本人发言。
  • 事实核查:每位人物页面均列出历史验证内容与叙事重构内容的区别。
  • 透明度:通过阅读代码可验证隐私和架构声明。

6. 合规性与无障碍

  • 合规:符合 GDPR、欧盟《人工智能法案》第50条以及德国《青少年媒体保护条例》(JMStV)。
  • 无障碍:符合 WCAG 2.2 AA 标准,支持键盘导航、屏幕阅读器,触摸目标大小为44px。
  • 安全:多层内容筛选、危机资源链接、越狱检测及PII(个人身份信息)保护。

7. 关于 Google Click ID (gclid) 的特别说明

项目方主动回应了关于数据隐私的质疑:如果用户通过 Google 广告访问并选择加入,服务器端会将 Google 点击 ID (gclid) 转发给 Google Ads 以匹配转化数据。这被视为个人数据,但仅服务器端转发,且不将其与自有分析数据关联。其他所有用户或拒绝加入的用户,均不会向 Google 发送任何数据。

关键要点

  • 非营利驱动:由德国非营利组织 ChipMates 运营,使命是普及智慧,而非追求投资者回报或用户参与度最大化。
  • 完全开源与自托管:代码 AGPL-3.0 开源,支持 Docker 一键部署,允许用户完全掌控数据流。
  • 隐私优先设计
    • 无注册门槛(每日30条免费消息)。
    • 无行为追踪、无画像、无IP留存。
    • 支持 BYOK(自带密钥)并本地加密。
    • 实时语音处理在德国自有服务器完成,音频数据存储在欧盟。
  • 教育科学基础:对话结构基于科尔布学习循环和布鲁姆分类法,旨在提供结构化的学习体验,而非简单的闲聊。
  • 技术栈亮点
    • 使用 Qwen3 235B 作为主要推理模型。
    • 音频技术包括 Kokoro (EN), Qwen3-TTS (DE), F5 (DE), Faster-Whisper。
    • 支持本地模式,实现数据不出本地。
  • 伦理透明:明确区分“AI演绎”与“历史事实”,提供详细的事实核查清单。
  • 社区参与:非技术人员可通过应用内的社区面板投票决定新增人物,开发者可贡献代码、翻译或修复Bug。

意义与影响

Agora Cosmica 的出现为 AI 行业提供了另一种可能性:AI 产品可以不依赖数据剥削和成瘾性设计,而是通过透明度、用户赋权和教育价值来建立信任。

  1. 重新定义 AI 伦理:通过“AI Echo”的明确框架和事实核查机制,该项目展示了如何在利用大语言模型进行角色扮演时,保持对历史真实性的尊重和对用户的诚实。
  2. 隐私保护的标杆:在普遍存在数据收集的行业背景下,其“无追踪、无画像、本地加密、欧盟托管”的技术架构,为注重隐私的用户和教育机构提供了一个可信的替代方案。特别是其主动公开 gclid 处理逻辑的做法,体现了极高的透明度。
  3. 教育科技的创新:将 AI 对话与经过验证的教育心理学框架(如检索练习、经验学习循环)相结合,使得 AI 不仅是聊天工具,更成为结构化的学习伴侣。
  4. 非营利开源模式的示范:证明了非营利组织可以通过开源项目和技术服务,在不牺牲隐私和伦理的前提下,提供高质量的人工智能应用。其从私有版权向 CC-BY 4.0 过渡的计划,也体现了促进知识共享的承诺。

对于开发者、教育工作者和隐私倡导者而言,Agora Cosmica 不仅是一个可体验的应用,更是一个值得审计和学习的代码库,展示了如何在工程实践中贯彻“隐私

查看原文 →github.com