技术博客arXiv cs.AI·2 小时前

多代理模型信息不对称博弈提升预测准确度

原标题：Diverse Evidence, Better Forecasts: Multi-Agent Deliberation Under Information Asymmetry

速览

该研究提出在多代理系统中引入信息不对称机制，通过将证据分割为共享公有和独占私有部分，解决现有方法中证据相同导致的从众偏差问题。理论分析证明这种分解能降低代理间误差相关性，框架InfoDelphi结合相关性感知路由、基于理由的迭代辩论和置信加权聚合，在PolyGym基准375道二元预测问题上取得显著提升。实验表明去除信息不对称将消除绝大部分收益，证明多样化输入是有效多代理推理的关键，适用于提升预测市场的可靠性。

AI 深度解读

背景

多代理系统（multi-agent systems）在未来事件预测中的应用日益广泛，已成为人工智能领域的重要研究方向。现有研究普遍认为，多个大型语言模型（LLMs）之间的审议过程能够显著提升推理能力和校准效果。然而，现有方法在设计层面存在一个关键缺失：即每个代理接收何种信息。当所有代理获得完全相同的证据时，审议过程往往会退化为从众行为（herding），而非真正的信念修订（genuine belief revision）。在这种情况下，多代理系统与单一代理系统相比几乎没有实质性改进。这暴露了多代理预测框架中的一个根本设计缺陷。

核心内容

文章指出，这一缺陷源于信息不对称（information asymmetry）的缺失，并提出通过“设计信息不对称”（designed information asymmetry）来解决该问题。具体而言，将证据划分为两部分：共享的公共部分（shared public subsets）和互不相交的私有部分（disjoint private subsets）。在这种设计下，每个代理仅持有独有的私有知识，而这些知识只能通过审议过程传递给其他代理。

作者从理论角度证明，该证据划分方式能够显著降低代理之间的误差相关性（reduces inter-agent error correlation）。为了验证这一理论，他们设计并实现了一个名为InfoDelphi的框架。该框架包含三个核心组件：基于相关性的证据路由（relevance-aware evidence routing）、基于理由的迭代审议（rationale-based iterative deliberation）以及基于信心的聚合方法（confidence-weighted aggregation）。

在PolyGym基准测试中，PolyGym是一个由375个二元预测问题组成的基准，问题均来源于现实世界的预测市场。InfoDelphi在Brier分数（Brier score）上比最强的单一代理和多代理基线模型提升了12–18%，在准确率上提升了4–8个百分点。进一步的消融实验表明，移除信息不对称后，大多数审议带来的性能增益消失，充分证明输入多样性（diversity of input）是有效多代理推理的核心驱动力。

关键要点

多代理系统在预测任务中面临的核心设计缺陷是信息不对称缺失，当所有代理接收相同证据时，审议易退化为herding行为而非信念修订。
通过将证据分解为共享公共部分与互不相交私有部分，可实现真正的信息不对称，每个代理仅通过审议传递私有知识。
理论分析表明，该划分方法能有效降低代理间的误差相关性。
InfoDelphi框架整合了相关性感知证据路由、基于理由的迭代审议及基于信心的聚合机制。
在PolyGym基准（375个二元预测市场问题）上，InfoDelphi在Brier分数上提升12–18%，准确率提升4–8个百分点。
消融实验证实，移除信息不对称后审议增益大部分消失，输入多样性是多代理推理的关键使能因素。

意义与影响

该研究为多代理预测系统提供了清晰的设计范式，标志着从“同质证据审议”向“异质证据协同”的范式转变。在实际应用中，InfoDelphi的框架可直接应用于预测市场、风险评估、政策制定等需要多主体理性判断的场景，推动多代理系统从“集体智慧”向“高效决策”演进。未来，该思路有望扩展到更复杂的时序预测、协作博弈及长上下文推理任务，进一步提升人工智能在不确定性环境下的泛化能力。

查看原文 →arxiv.org

多代理模型信息不对称博弈提升预测准确度

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐