← 返回信息流
AI 资讯Hacker News·4 小时前

可编程概率计算机问世:集成百万级p-bit

原标题:Programmable Probabilistic Computer with 1M p-bits

速览

研究人员成功开发出一种可编程概率计算机,其核心集成了百万个p-bit(概率位)。该硬件利用概率计算机制,有望在能效和速度上显著超越传统二进制芯片,特别适用于机器学习推理等场景。这一突破为构建下一代低功耗、高能效的人工智能硬件基础设施提供了重要可能性。

AI 深度解读

可编程百万级 p-bit 概率计算机:突破单芯片限制

背景

概率计算机(Probabilistic Computers)是一种利用随机性进行计算的新型硬件架构,其核心单元被称为 p-bit(probabilistic bit,概率比特)。与传统的确定性比特(0 或 1)不同,p-bit 在 0 和 1 之间快速随机翻转,其翻转概率由外部输入信号控制。这种特性使其成为处理采样(Sampling)和优化问题(特别是伊辛模型,Ising Models)的理想硬件加速器。

然而,现有的基于 p-bit 的概率计算机系统主要受限于单个芯片的物理容量和内存带宽。由于伊辛模型中的耦合权重(Coupling Weights)需要存储在本地内存中,单芯片上的 p-bit 数量难以大幅扩展,这限制了其在大规模复杂问题求解中的应用潜力。如何在保持低通信开销的同时,将 p-bit 的数量从单芯片规模扩展到百万级甚至更高,成为该领域面临的关键技术瓶颈。

核心内容

本文介绍了一种通过联网现场可编程门阵列(FPGAs)构建的可编程概率计算机,成功实现了拥有 1,000,000 个 p-bit 的系统,打破了以往局限于单芯片设备的容量上限。

1. 架构设计:分布式伊辛机

研究团队将多个 FPGA 设备连接起来,形成一个单一的、大规模的伊辛机(Ising Machine)。该架构的核心创新在于其通信机制:在执行计算过程中,设备之间仅交换 1-bit 的边界状态(boundary states)。这种极简的通信协议极大地降低了分布式系统间的同步开销,使得系统能够高效扩展。

2. 性能表现

该百万级 p-bit 平台在执行吉布斯采样(Gibbs Sampling)时,翻转速率超过每秒一万亿次(1 trillion flips per second)。关键在于,系统在执行过程中,所有的耦合权重都保留在各自的片上本地内存中,无需频繁访问外部存储或进行大规模数据搬运。

3. 核心发现:通信频率与性能的关系

分布式采样器面临的一个根本性问题是:为了模拟未分区(monolithic)机器的行为,边界信息必须多久刷新一次?

研究人员使用三维 Edwards-Anderson 自旋玻璃(Edwards-Anderson spin glasses)作为测试基准,发现这一频率由一个单一的时间比率 $\eta$ 决定: $$ \eta = f_{comm} / f_{p-bit} $$ 其中,$f_{comm}$ 是边界交换频率,$f_{p-bit}$ 是局部 p-bit 更新频率。

  • 高于阈值:当 $\eta$ 超过依赖于拓扑结构的阈值时,分布式机器的性能与单体 GPU 参考模型相匹配,能够准确求解问题。
  • 低于阈值:当 $\eta$ 低于该阈值时,系统的残余能量仍遵循幂律衰减,但衰减指数降低。这意味着并行性转化为了一种可量化的“吞吐量-准确性”权衡(throughput-accuracy tradeoff)。

4. 理论验证与通用性

研究建立了一个理论集群平均场模型(cluster mean-field model),该模型复现了上述实验行为,证明了这种权衡是分区随机动力学(partitioned stochastic dynamics)的普遍特性。

5. 应用演示

该平台已在多种问题上进行了演示,包括:

  • 自旋玻璃问题
  • Max-Cut(最大割问题)
  • 布尔可满足性问题(Boolean satisfiability, SAT)

关键要点

  • 规模突破:首次实现了拥有 1,000,000 个 p-bit 的可编程概率计算机,远超此前单芯片系统的限制。
  • 极简通信:分布式设备间仅交换 1-bit 边界状态,所有耦合权重保留在本地片上内存,极大提升了扩展效率。
  • 性能指标:吉布斯采样翻转速率超过每秒一万亿次。
  • 关键参数 $\eta$:定义了边界交换频率与局部 p-bit 更新频率的比率。该比率存在一个拓扑依赖的阈值,决定了分布式系统能否等效于单体系统。
  • 权衡机制:低于阈值时,系统性能下降表现为残余能量衰减指数的降低,揭示了并行计算中吞吐量与准确性之间的定量权衡关系。
  • 理论支撑:集群平均场模型证实了该权衡是分区随机动力学的通用属性,为未来扩展提供了理论依据。

意义与影响

这项研究为概率计算机的规模化扩展提供了重要的工程实现和理论指导。

  1. 打破硬件瓶颈:通过联网 FPGA 实现百万级 p-bit,证明了分布式架构可以有效克服单芯片容量和内存带宽的限制,为构建更大规模的概率计算硬件铺平了道路。
  2. 提供设计准则:提出的时间比率 $\eta$ 及其阈值概念,为设计大规模分布式概率计算机提供了定量的设计规则。开发者可以根据所需的准确性和吞吐量,调整通信频率与计算频率的比例。
  3. 验证通用性:通过理论模型与实验结果的一致性,证明了分布式采样中的性能权衡是随机动力学的固有属性,而非特定硬件实现的缺陷。这有助于学术界和工业界更准确地评估和预测大规模概率计算机的性能边界。
  4. 推动实际应用:该平台在 Max-Cut 和 SAT 等经典 NP 难问题上的成功演示,展示了其在解决复杂优化问题方面的潜力,为未来在人工智能、组合优化等领域的应用奠定了基础。
查看原文 →arxiv.org