技术博客arXiv cs.AI·2 小时前

模块化AI新范式：通过多元参与实现系统扩展

原标题：Scaling Participation in Modular AI Systems

速览

论文提出“扩展参与”新范式，构建由多元利益相关者贡献的小型模型组成的模块化AI系统。实验显示，该系统在推理和事实性等15项任务中性能超越单体LLM最高达15.4%，且优于所有组件之和。这种自下而上的协作模式展现出涌现能力，为解决单体模型无法处理的难题提供了技术基础。

AI 深度解读

扩展参与：模块化 AI 系统的新范式

背景

当前，大型语言模型（LLMs）的开发与部署呈现出高度集中的态势。尽管人类社会拥有多元的才能、需求和价值观，但绝大多数用户所使用的 AI 模型却是由少数机构或团队构建的。这种“单体 AI 模型”（monolithic AI models）的市场结构，在本质上难以捕捉人类知识、推理能力和价值观的丰富多样性。

现有的中心化开发模式存在结构性缺陷：它假设存在一个通用的、适用于所有人的“最佳”模型，却忽视了不同群体在特定领域、文化背景或专业需求上的细微差别。这种自上而下的构建方式，不仅限制了 AI 对长尾需求的支持，也导致了模型在特定任务上的表现往往无法超越其训练数据的局限性。

核心内容

本文提出了一种名为“扩展参与”（Scaling Participation）的新范式，旨在通过自下而上的方式，构建由多样化利益相关者贡献的模块化 AI 系统。

1. 核心机制：从单体到模块化

该范式不再依赖单一的大型模型来覆盖所有任务，而是允许参与者贡献小型模型（small models）。这些小型模型专门针对贡献者自身的兴趣、优先级和数据分布进行训练。随后，这些异构的小型模型在一个模块化框架中进行协作，组合成一个“组合式 AI 系统”（compositional AI systems）。

2. 性能优势

实验数据显示，这种参与式 AI 系统在多个维度上优于传统的单体 LLMs：

综合性能提升：在包括推理（reasoning）和事实准确性（factuality）在内的 15 项任务中，参与式 AI 系统的表现比单体 LLMs 高出高达 15.4%。
超越规模限制：其性能甚至超越了所有贡献组件模型规模之和更大的单体模型。这意味着，通过高效的模块组合，小模型的集合可以击败参数规模巨大的单一模型。

3. 多样性与涌现能力

进一步的实验揭示了该范式的两个关键特性：

多样性红利：参与式 AI 系统从贡献者的多样性中获益匪浅。不同背景、不同数据源的模型贡献，使得系统能够覆盖更广泛的知识领域。
优先级优化：系统能够显著改善每个贡献者原本关注的特定优先任务的表现。
涌现能力（Emergent Capabilities）：系统展现出个体模型所不具备的解决复杂问题的能力。数据显示，在所有单个模型均失败的问题中，参与式 AI 系统能够解决超过 15% 的案例。这表明模块间的协作产生了“1+1>2”的效果。

关键要点

范式转变：从“少数人构建通用大模型”转向“多数人贡献专用小模型”，实现 AI 系统的自下而上构建。
模块化架构：系统由多个针对特定兴趣或优先级训练的小型模型组成，通过模块化框架进行协作，形成组合式 AI。
性能超越：在 15 项任务中，参与式系统比单体 LLMs 性能高出 15.4%，且能击败参数规模更大的单体模型。
多样性价值：贡献者的多样性直接提升了系统的整体鲁棒性和覆盖面，使系统能更好地反映人类知识的丰富性。
解决长尾问题：系统具备涌现能力，能够解决超过 15% 的个体模型无法解决的难题，体现了协作带来的智能涌现。
未来愿景：为从当前的单体 AI 现状向开放、自下而上、协作式的 AI 未来过渡提供了技术基础。

意义与影响

“扩展参与”范式不仅是一个技术上的突破，更是对 AI 开发民主化的一次重要探索。

首先，它解决了单体模型在捕捉人类多样性方面的结构性不足。通过允许不同群体贡献反映自身价值观和知识的小模型，AI 系统能够更准确地服务于多元化的用户需求，减少主流模型可能带来的偏见或盲区。

其次，它提供了一种更具可扩展性和可持续性的 AI 发展路径。相比于训练和部署超大规模单体模型所需的巨大计算资源和能源消耗，模块化系统允许利用边缘设备或专用算力进行局部训练，并通过网络协作实现全局智能。这不仅降低了参与门槛，也促进了 AI 技术的去中心化发展。

最后，这一范式预示着 AI 生态系统的根本性变革。未来，AI 可能不再是由少数科技巨头垄断的“黑盒”，而是一个由无数专业模块组成的开放市场。用户和开发者可以通过贡献自己的数据或模型，直接塑造 AI 的行为和能力，从而构建一个更加开放、协作且以人为本的 AI 未来。

查看原文 →arxiv.org