AI 资讯Hacker News·1 小时前

Apertus发布开放主权AI基础模型

原标题：Apertus – Open Foundation Model for Sovereign AI

速览

Apertus基金会发布了名为Apertus的开放基础模型，专注于主权AI领域。该模型旨在为各国或组织提供独立、可控的人工智能基础设施，减少对单一商业巨头的依赖。此举有助于推动全球AI生态的多元化发展，保障数据主权与技术自主性。

AI 深度解读

背景

在人工智能领域，大型语言模型（LLM）的训练数据、权重和方法论往往被少数科技巨头垄断，形成了封闭的“黑盒”生态。与此同时，随着欧盟《人工智能法案》（EU AI Act）等监管框架的推进，AI 的透明度、可追溯性以及合规性成为了行业关注的焦点。

在此背景下，瑞士人工智能倡议（Swiss AI Initiative）联合洛桑联邦理工学院（EPFL）、苏黎世联邦理工学院（ETH Zurich）以及瑞士国家超级计算中心（CSCS）共同推出了 Apertus。这不仅仅是一个模型，更是一个旨在推动“主权 AI”（Sovereign AI）发展的开源基础模型项目。该项目强调“开放权重、开放数据、开放科学”，试图建立一个全球性的、可复现的 AI 基础架构，其理念类比于开源软件运动中的“Open Source”。

核心内容

Apertus 项目的核心在于其彻底的开放性与合规性设计，具体包含以下几个维度：

模型系列与规模：项目发布了一套包含 16 个小规模语言模型的系列，旨在展示知识蒸馏（distillation）和量化（quantization）等技术的应用。这些模型在参数规模上与主流的 8B（80亿参数）和 70B（700亿参数）模型具有竞争力，能够与顶级开源模型相媲美。
完全透明的研发流程： Apertus 坚持“Open Science”（开放科学）原则。从训练数据、源代码、模型权重，到训练方法和对齐原则（alignment principles），所有环节均经过详细文档记录并具备可复现性。这种透明度旨在消除 AI 开发中的不确定性，让社区能够验证和改进模型。
多语言支持：模型从第一天起就具备多语言能力，训练数据覆盖了 1000 多种语言，使其具备全球适用的潜力。
合规性与隐私保护：为了严格符合欧盟《人工智能法案》的要求，Apertus 在架构设计上内置了隐私保护机制：
- 尊重退出机制：尊重数据主体的退出意愿。
- 去除个人身份信息（PII）：自动移除训练数据中的敏感个人信息。
- 防止记忆化：通过技术手段防止模型“记忆”并泄露训练数据中的敏感内容。
合作生态：该项目是 EPFL、ETH Zurich 和 CSCS 之间的协作成果，并得到了瑞士电信（Swisscom）作为战略伙伴的支持。

关键要点

开源理念对标：Apertus 的定位是 AI 领域的“Open Source”，强调开放权重、开放数据和开放科学，致力于成为构建主权 AI 的全球基础。
技术竞争力：尽管定位为小型模型系列，但其在 8B 和 70B 参数规模下，性能可与当前顶级的开源模型竞争。
极致的透明度：训练数据、代码、权重、方法论及对齐原则全部公开且可复现，打破了传统大模型开发的黑盒模式。
严格的合规设计：原生支持欧盟《人工智能法案》要求，具备去除 PII、防止记忆化和尊重用户退出权的能力，解决了数据隐私与合规痛点。
超大规模多语言：支持 1000+ 种语言，具备极强的泛化能力和全球适用性。
瑞士顶尖机构背书：由瑞士 AI 倡议主导，EPFL、ETH Zurich 和 CSCS 联合开发，Swisscom 提供战略支持，代表了瑞士在 AI 基础设施领域的最高水平。

意义与影响

Apertus 的发布标志着 AI 发展从“封闭竞赛”向“开放协作与合规并重”的重要转折。

首先，它回应了全球对“主权 AI”的迫切需求。通过提供完全透明、可审计且符合严格监管标准（如欧盟 AI Act）的基础模型，Apertus 为政府、企业和研究机构提供了一个可信的替代方案，减少了对少数非透明商业模型的依赖。

其次，它确立了“可复现性”在 AI 研究中的新标准。在模型权重和数据集日益成为稀缺资源的今天，Apertus 公开所有训练细节和对齐原则，有助于推动 AI 科学回归严谨的实证研究，促进社区层面的协作创新。

最后，其内置的隐私保护机制（如防止记忆化和去除 PII）为 AI 在医疗、金融等敏感行业的应用扫清了合规障碍。这不仅是一个技术产品，更是一种新的 AI 治理范式，展示了如何在追求模型性能的同时，兼顾伦理、隐私和法律合规。

查看原文 →apertvs.ai

Apertus发布开放主权AI基础模型

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐