← 返回信息流
AI 资讯Hacker News·1 小时前

Apertus发布开放主权AI基础模型

原标题:Apertus – Open Foundation Model for Sovereign AI

速览

Apertus基金会发布了名为Apertus的开放基础模型,专注于主权AI领域。该模型旨在为各国或组织提供独立、可控的人工智能基础设施,减少对单一商业巨头的依赖。此举有助于推动全球AI生态的多元化发展,保障数据主权与技术自主性。

AI 深度解读

背景

在人工智能领域,大型语言模型(LLM)的训练数据、权重和方法论往往被少数科技巨头垄断,形成了封闭的“黑盒”生态。与此同时,随着欧盟《人工智能法案》(EU AI Act)等监管框架的推进,AI 的透明度、可追溯性以及合规性成为了行业关注的焦点。

在此背景下,瑞士人工智能倡议(Swiss AI Initiative)联合洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)共同推出了 Apertus。这不仅仅是一个模型,更是一个旨在推动“主权 AI”(Sovereign AI)发展的开源基础模型项目。该项目强调“开放权重、开放数据、开放科学”,试图建立一个全球性的、可复现的 AI 基础架构,其理念类比于开源软件运动中的“Open Source”。

核心内容

Apertus 项目的核心在于其彻底的开放性与合规性设计,具体包含以下几个维度:

  1. 模型系列与规模: 项目发布了一套包含 16 个小规模语言模型的系列,旨在展示知识蒸馏(distillation)和量化(quantization)等技术的应用。这些模型在参数规模上与主流的 8B(80亿参数)和 70B(700亿参数)模型具有竞争力,能够与顶级开源模型相媲美。

  2. 完全透明的研发流程: Apertus 坚持“Open Science”(开放科学)原则。从训练数据、源代码、模型权重,到训练方法和对齐原则(alignment principles),所有环节均经过详细文档记录并具备可复现性。这种透明度旨在消除 AI 开发中的不确定性,让社区能够验证和改进模型。

  3. 多语言支持: 模型从第一天起就具备多语言能力,训练数据覆盖了 1000 多种语言,使其具备全球适用的潜力。

  4. 合规性与隐私保护: 为了严格符合欧盟《人工智能法案》的要求,Apertus 在架构设计上内置了隐私保护机制:

    • 尊重退出机制:尊重数据主体的退出意愿。
    • 去除个人身份信息(PII):自动移除训练数据中的敏感个人信息。
    • 防止记忆化:通过技术手段防止模型“记忆”并泄露训练数据中的敏感内容。
  5. 合作生态: 该项目是 EPFL、ETH Zurich 和 CSCS 之间的协作成果,并得到了瑞士电信(Swisscom)作为战略伙伴的支持。

关键要点

  • 开源理念对标:Apertus 的定位是 AI 领域的“Open Source”,强调开放权重、开放数据和开放科学,致力于成为构建主权 AI 的全球基础。
  • 技术竞争力:尽管定位为小型模型系列,但其在 8B 和 70B 参数规模下,性能可与当前顶级的开源模型竞争。
  • 极致的透明度:训练数据、代码、权重、方法论及对齐原则全部公开且可复现,打破了传统大模型开发的黑盒模式。
  • 严格的合规设计:原生支持欧盟《人工智能法案》要求,具备去除 PII、防止记忆化和尊重用户退出权的能力,解决了数据隐私与合规痛点。
  • 超大规模多语言:支持 1000+ 种语言,具备极强的泛化能力和全球适用性。
  • 瑞士顶尖机构背书:由瑞士 AI 倡议主导,EPFL、ETH Zurich 和 CSCS 联合开发,Swisscom 提供战略支持,代表了瑞士在 AI 基础设施领域的最高水平。

意义与影响

Apertus 的发布标志着 AI 发展从“封闭竞赛”向“开放协作与合规并重”的重要转折。

首先,它回应了全球对“主权 AI”的迫切需求。通过提供完全透明、可审计且符合严格监管标准(如欧盟 AI Act)的基础模型,Apertus 为政府、企业和研究机构提供了一个可信的替代方案,减少了对少数非透明商业模型的依赖。

其次,它确立了“可复现性”在 AI 研究中的新标准。在模型权重和数据集日益成为稀缺资源的今天,Apertus 公开所有训练细节和对齐原则,有助于推动 AI 科学回归严谨的实证研究,促进社区层面的协作创新。

最后,其内置的隐私保护机制(如防止记忆化和去除 PII)为 AI 在医疗、金融等敏感行业的应用扫清了合规障碍。这不仅是一个技术产品,更是一种新的 AI 治理范式,展示了如何在追求模型性能的同时,兼顾伦理、隐私和法律合规。

查看原文 →apertvs.ai