技术博客arXiv cs.CL·4 小时前

多智能体交互中表征相似性影响合作与创新

原标题：Representational Similarity and Model Behavior in Multi-Agent Interaction

速览

研究考察了276对大语言模型在合作与新颖性任务中的交互表现。结果显示，表征空间越相似，模型间合作越成功，但创新性和创造力显著降低。早期层的表征相似性与合作及新颖性关联最强，表明词汇和语义基础共享是关键因素。这一发现为多智能体系统的设计提供了重要参考。

AI 深度解读

表征相似性与多智能体交互中的模型行为

背景

在人类社会科学领域，研究者早已发现一个有趣的现象：人类之间的神经相似性（neural similarity）能够预测社交亲密度和合作成功率。然而，创新往往诞生于那些思维方式、背景或认知结构存在差异的个体之间的互动。简而言之，相似性促进合作，而差异性激发创新。

随着大型语言模型（LLM）在多智能体系统（Multi-Agent Systems, MAS）中的应用日益广泛，一个核心问题浮现出来：上述关于人类社会的认知原则是否同样适用于人工智能？当两个或多个 LLM 进行交互时，它们的内部表征（representations）的相似程度是否会影响其合作效率以及产生新颖、创造性结果的能力？

这篇发表于 arXiv（cs.CL 类别，提交于 2026 年 6 月 5 日）的研究论文《Representational Similarity and Model Behavior in Multi-Agent Interaction》正是为了回答这一问题。研究团队通过控制变量的实验，深入探讨了模型内部表征结构与多智能体交互行为之间的因果关系。

核心内容

本研究旨在验证“神经相似性促进合作，而差异性促进创新”这一假设在人工智能领域的适用性。研究人员构建了一个包含 276 对模型对的实验环境，这些模型对在不同的任务场景中进行了交互。

实验设计

模型对数量：276 对。
交互场景：涵盖了 8 款不同的游戏，这些游戏被设计用来测试两个维度：
1. 合作性（Cooperation）：需要双方协调行动以达成共同目标。
2. 新颖性/创造性（Novelty/Creativity）：需要双方产生非传统、独特的解决方案或互动模式。
分析维度：研究不仅关注最终的交互结果，还深入分析了模型内部的表征空间（representation spaces），特别是不同网络层（早期、中期、晚期）的相似性对行为的影响。

主要发现

表征相似性与合作正相关：实验数据显示，那些拥有更相似表征空间的模型对，在合作任务中取得了显著更高的成功率。这意味着，当两个模型在内部理解世界的方式、语义映射或逻辑结构上高度一致时，它们更容易达成默契，实现高效协作。
表征相似性与新颖性负相关：相反，高相似性导致了新颖性和创造力的下降。当两个模型“想法”太像时，它们倾向于重复彼此的路径或策略，难以跳出固有思维框架，从而无法产生具有创新性的互动结果。
结果的鲁棒性：为了排除干扰因素，研究人员控制了其他变量，如模型的性能差异（performance disparity）和模型规模（model size）。结果显示，即使在这些因素被控制后，表征相似性对合作和新颖性的影响依然显著且稳健。这表明，内部结构的相似性是驱动行为差异的核心因素，而非简单的能力高低或参数多少。
早期层的关键作用：研究进一步分析了神经网络不同层的表征相似性。结果表明，**早期层（early layers）**的相似性与合作及新颖性表现出最强的关联性，相比之下，中间层和晚期层的关联性较弱。
- 解读：神经网络的早期层通常负责捕捉基础的词汇（lexical）和语义（semantic）接地（grounding）。这一发现暗示，两个模型是否共享相同的基础语言理解和语义映射，是决定它们能否高效合作或激发创新的关键。如果两个模型对基础词汇和概念的理解不一致，即使高层逻辑结构相似，也难以实现深层的协同或创新。

关键要点

相似性双刃剑：在多智能体系统中，模型表征的相似性是一把双刃剑。它极大地提升了合作效率，但抑制了创新潜力。
早期层主导行为：模型内部表征的相似性对行为的影响主要集中在网络的早期层，这指向了词汇和语义接地（lexical and semantic grounding）共享程度的重要性。
独立于性能与规模：表征相似性的影响是独立的，不依赖于模型的大小或基础性能差异。
设计启示：在多智能体系统的设计中，不能仅追求模型的高性能或高一致性。为了平衡合作与创新，可能需要有意引入具有不同表征结构（特别是不同语义接地方式）的模型。

意义与影响

这项研究为多智能体系统（MAS）的设计提供了重要的理论依据和实践指导：

系统架构设计的权衡：传统的多智能体系统往往倾向于使用同构模型（homogeneous models）以确保兼容性和协作效率。然而，本研究证明，过度依赖高相似性的模型会牺牲系统的创新能力。设计师需要在“协作效率”和“创新多样性”之间进行权衡。如果目标是解决复杂、需要突破常规的问题，引入具有不同表征结构的异构模型可能是必要的。
理解 AI 的“认知”基础：通过将人类社会的认知原则映射到 AI 模型，研究揭示了 LLM 内部表征与外部行为之间的深层联系。特别是早期层相似性对行为的主导作用，提示我们在调试多智能体交互问题时，应重点关注模型的基础语义理解层，而不仅仅是高层策略层。
未来研究方向：该研究为后续探索如何主动调节模型间的表征相似性提供了方向。例如，可以通过微调（fine-tuning）或提示工程（prompt engineering）来调整模型的早期层表征，从而在特定任务中动态平衡合作与创新。此外，这也为开发更具人类-like 社交智能的 AI 系统提供了新的评估指标——即不仅看任务完成率，还要看模型间的“认知距离”。

总之，这项研究强调了在多智能体交互中，“我们如何思考”（内部表征）比“我们有多大”（模型规模）或“我们多聪明”（基础性能）更能决定我们如何一起工作以及如何共同创新。

查看原文 →arxiv.org