← 返回信息流
技术博客arXiv cs.CL·4 小时前

多智能体交互中表征相似性影响合作与创新

原标题:Representational Similarity and Model Behavior in Multi-Agent Interaction

速览

研究考察了276对大语言模型在合作与新颖性任务中的交互表现。结果显示,表征空间越相似,模型间合作越成功,但创新性和创造力显著降低。早期层的表征相似性与合作及新颖性关联最强,表明词汇和语义基础共享是关键因素。这一发现为多智能体系统的设计提供了重要参考。

AI 深度解读

表征相似性与多智能体交互中的模型行为

背景

在人类社会科学领域,研究者早已发现一个有趣的现象:人类之间的神经相似性(neural similarity)能够预测社交亲密度和合作成功率。然而,创新往往诞生于那些思维方式、背景或认知结构存在差异的个体之间的互动。简而言之,相似性促进合作,而差异性激发创新。

随着大型语言模型(LLM)在多智能体系统(Multi-Agent Systems, MAS)中的应用日益广泛,一个核心问题浮现出来:上述关于人类社会的认知原则是否同样适用于人工智能?当两个或多个 LLM 进行交互时,它们的内部表征(representations)的相似程度是否会影响其合作效率以及产生新颖、创造性结果的能力?

这篇发表于 arXiv(cs.CL 类别,提交于 2026 年 6 月 5 日)的研究论文《Representational Similarity and Model Behavior in Multi-Agent Interaction》正是为了回答这一问题。研究团队通过控制变量的实验,深入探讨了模型内部表征结构与多智能体交互行为之间的因果关系。

核心内容

本研究旨在验证“神经相似性促进合作,而差异性促进创新”这一假设在人工智能领域的适用性。研究人员构建了一个包含 276 对模型对的实验环境,这些模型对在不同的任务场景中进行了交互。

实验设计

  • 模型对数量:276 对。
  • 交互场景:涵盖了 8 款不同的游戏,这些游戏被设计用来测试两个维度:
    1. 合作性(Cooperation):需要双方协调行动以达成共同目标。
    2. 新颖性/创造性(Novelty/Creativity):需要双方产生非传统、独特的解决方案或互动模式。
  • 分析维度:研究不仅关注最终的交互结果,还深入分析了模型内部的表征空间(representation spaces),特别是不同网络层(早期、中期、晚期)的相似性对行为的影响。

主要发现

  1. 表征相似性与合作正相关: 实验数据显示,那些拥有更相似表征空间的模型对,在合作任务中取得了显著更高的成功率。这意味着,当两个模型在内部理解世界的方式、语义映射或逻辑结构上高度一致时,它们更容易达成默契,实现高效协作。

  2. 表征相似性与新颖性负相关: 相反,高相似性导致了新颖性和创造力的下降。当两个模型“想法”太像时,它们倾向于重复彼此的路径或策略,难以跳出固有思维框架,从而无法产生具有创新性的互动结果。

  3. 结果的鲁棒性: 为了排除干扰因素,研究人员控制了其他变量,如模型的性能差异(performance disparity)和模型规模(model size)。结果显示,即使在这些因素被控制后,表征相似性对合作和新颖性的影响依然显著且稳健。这表明,内部结构的相似性是驱动行为差异的核心因素,而非简单的能力高低或参数多少。

  4. 早期层的关键作用: 研究进一步分析了神经网络不同层的表征相似性。结果表明,**早期层(early layers)**的相似性与合作及新颖性表现出最强的关联性,相比之下,中间层和晚期层的关联性较弱。

    • 解读:神经网络的早期层通常负责捕捉基础的词汇(lexical)和语义(semantic)接地(grounding)。这一发现暗示,两个模型是否共享相同的基础语言理解和语义映射,是决定它们能否高效合作或激发创新的关键。如果两个模型对基础词汇和概念的理解不一致,即使高层逻辑结构相似,也难以实现深层的协同或创新。

关键要点

  • 相似性双刃剑:在多智能体系统中,模型表征的相似性是一把双刃剑。它极大地提升了合作效率,但抑制了创新潜力。
  • 早期层主导行为:模型内部表征的相似性对行为的影响主要集中在网络的早期层,这指向了词汇和语义接地(lexical and semantic grounding)共享程度的重要性。
  • 独立于性能与规模:表征相似性的影响是独立的,不依赖于模型的大小或基础性能差异。
  • 设计启示:在多智能体系统的设计中,不能仅追求模型的高性能或高一致性。为了平衡合作与创新,可能需要有意引入具有不同表征结构(特别是不同语义接地方式)的模型。

意义与影响

这项研究为多智能体系统(MAS)的设计提供了重要的理论依据和实践指导:

  1. 系统架构设计的权衡: 传统的多智能体系统往往倾向于使用同构模型(homogeneous models)以确保兼容性和协作效率。然而,本研究证明,过度依赖高相似性的模型会牺牲系统的创新能力。设计师需要在“协作效率”和“创新多样性”之间进行权衡。如果目标是解决复杂、需要突破常规的问题,引入具有不同表征结构的异构模型可能是必要的。

  2. 理解 AI 的“认知”基础: 通过将人类社会的认知原则映射到 AI 模型,研究揭示了 LLM 内部表征与外部行为之间的深层联系。特别是早期层相似性对行为的主导作用,提示我们在调试多智能体交互问题时,应重点关注模型的基础语义理解层,而不仅仅是高层策略层。

  3. 未来研究方向: 该研究为后续探索如何主动调节模型间的表征相似性提供了方向。例如,可以通过微调(fine-tuning)或提示工程(prompt engineering)来调整模型的早期层表征,从而在特定任务中动态平衡合作与创新。此外,这也为开发更具人类-like 社交智能的 AI 系统提供了新的评估指标——即不仅看任务完成率,还要看模型间的“认知距离”。

总之,这项研究强调了在多智能体交互中,“我们如何思考”(内部表征)比“我们有多大”(模型规模)或“我们多聪明”(基础性能)更能决定我们如何一起工作以及如何共同创新。

查看原文 →arxiv.org