← 返回信息流
AI 资讯Hacker News·1 天前

RTX 50系列支持外部时钟生成技术

原标题:External Clock Generation on RTX 50 Series

速览

NVIDIA在RTX 50系列显卡中引入了外部时钟生成(External Clock Generation)功能。这一技术允许用户通过外部信号源精确同步显卡时钟,为多卡互联和高性能计算提供更高的时序灵活性。该特性主要面向专业工作站和超频爱好者,有助于优化系统整体同步性能。

AI 深度解读

RTX 50 系列外部时钟生成技术深度解读

背景

在计算机硬件超频的历史长河中,改变参考时钟(Reference Clock)以突破芯片频率限制是一种经典且有效的手段。早在 20 世纪 70 年代末至 90 年代初,由于当时的系统缺乏通过软件或跳线调整时钟速度的机制,早期的超频爱好者不得不通过更换晶体振荡器(Crystal Swapping)来改变驱动芯片的参考时钟频率。在那个时代,通过这种方法实现的超频幅度甚至高达 16,000%。

随着 90 年代主板制造商开始引入跳线和软件控制 FSB(前端总线)时钟、内存时序等功能,超频变得更加便捷。进入 2000 年代及至今,针对显卡的软件超频工具(如 vBIOS 编辑器、电压工具等)总体上保持了较高的开放性。然而,自 NVIDIA Pascal 架构(GTX 10 系列)以来,对于大多数普通消费者而言,直接编辑 vBIOS 已不再可行,超频手段被限制为核心时钟和内存时钟的调整,部分情况下可通过 XOC vBIOS 及相关软件工具调整电压和功耗限制。随着时间的推移,官方提供的超频工具权限被逐步收紧。

目前,在高端 RTX 50 系列显卡上,用户已无法通过常规软件手段将显存时钟速度推至极限。此外,控制互连速度(类似于 Intel 的 D2D、环形总线或 AMD 的 FCLK)的隐藏时钟(如 Crossbar 时钟)也仅能通过刷入其他版本的 vBIOS 进行有限度的调整。这种软件层面的封锁促使硬核玩家转向硬件层面的修改,即“硬改”(Hardmod)。

核心内容

来自 Xtreme Systems 社区的用户 PickleRick 与 RF 工程专家 Turbogear 合作,成功在 RTX 50 系列显卡上实现了外部时钟生成(External Clock Generation)。这项技术旨在突破 NVIDIA 对 RTX 5090 施加的性能限制,通过硬件修改直接干预 GPU 的时钟信号输入。

理论假设

在高端 NVIDIA GPU(如 RTX 5090)中,超频玩家通常会对芯片进行“分级”(Binning),以寻找具有更高 Crossbar 时钟(xBAR,约 100MHz 范围)和更低标准电压(约 80mV 范围,由 NVIDIA 分配的 VF 曲线决定)的“黄金芯片”。例如,xBAR 时钟为 2600 MHz 的 RTX 5090 被视为普通,而 xBAR 时钟达到 2700 MHz 且能维持高 GPU 核心时钟的芯片则被视为极品。研究团队假设,如果能够通过外部手段同时改变 VRAM 和 xBAR 时钟,将能真正挖掘出这些芯片的极限性能。

测试与工程挑战

团队花费数周时间尝试使用 Elmor Labs 生产的 Elmor 外部时钟板(ECB)在 50 系列 GPU 上工作。初步基准测试结果显示,仅使用预算级水冷散热器的情况下,修改后的显卡便通过了多个液氮(LN2)级别的得分记录,远超预期。

然而,该方案目前仍处于开发阶段,存在显著的信号完整性问题:

  1. PLL 输入要求:高端 NVIDIA GPU 中的锁相环(PLL)期望输入一个约 1.15 VPP 的交流耦合正弦波/模拟波形。
  2. 信号不匹配:Elmor ECB 在 XTAL 输出端产生的是 1.6 VPP 的交流耦合方波/数字波形。
  3. 布线敏感性:普通导线的信号完整性是一个巨大挑战。早期的多次尝试因信号反射和干扰而失败。如果布线不理想,甚至只是靠近或快速移动靠近 GPU,都可能导致系统崩溃或无法开机(No Post)。
  4. 电路调优:由于 GPU 核心内的 PLL 会改变信号特性,且其属性未在任何公开规格书中说明,调优极其困难。团队需要在不损坏 PLL 的前提下降低 VPP,同时确保 GPU 能正常启动。
  5. 最终解决方案:经过对分压电路、RF 衰减器和低通滤波器的多次测试,团队发现最佳方案是在 Elmor ECB breakout 板上安装一个 20 欧姆的 0603 串联电阻,并将输出设置为 1800mV,驱动强度设为最低。这产生了一种在示波器上看起来并不理想(接近三角波)但在电路内 VPP 约为 1.2V(在合理范围内)的波形。尽管低通滤波器能让信号在示波器上看起来完美,但反射问题会导致 VPP 随频率变化超出规格;而在低通滤波器后添加 RF 衰减器虽解决了反射问题,却导致显卡无法开机。

测试结果

在已测试的显卡中,团队实现了以下性能提升:

  • 显存频率:相当于在 MSI Afterburner 中将内存滑块上调 +5467。
  • Crossbar 时钟:达到约 2920 MHz。
  • 性能增益:在 Port Royal 基准测试中,仅通过提升 Crossbar 时钟就获得了约 500 分的增益;将显存推至典型限制之外又增加了约 200 分。在将冷却液温度再降低 7°C 并进一步提升时钟后,最终得分比之前的最佳成绩高出 1500 分。

NVIDIA 报告的时钟速度是基于 27 MHz 参考时钟计算的,因此存在偏差。社区用户 ASGxx 创建了一个计算器用于计算实际时钟频率。

操作指南与风险

该修改涉及极高的硬件风险,作者明确表示不承担任何因使用外部时钟生成器(ECB)或其他硬改修改导致的硬件损坏、丢失或永久 GPU 故障的责任。

所需材料

  • Elmor ECB
  • 加热台、热风枪
  • 30 AWG 漆包线
  • 0603 封装 20 欧姆电阻
  • 金手指胶带(Kapton tape)
  • 透明/白色快速固化 UV 焊锡掩膜(用于应力消除)
  • UV 固化灯
  • SPDT 微型开关或 JST-XH 连接器
  • 通用焊接设备及知识

主要步骤

  1. 移除原厂晶体:使用加热台和热风枪移除 GPU 上的原厂 XTAL 振荡器,并用金手指胶带保护核心和显存 BGA 免受直接热风影响。
  2. 保留原厂功能:为了在开关或跳线控制下保留原厂运行,将 XTAL 水平翻转。制作 3 根跳线:2 根连接接地焊盘,1 根连接 XTAL 输出焊盘。
  3. 布线:将漆包线连接到 GPU PCB 上的 XTAL 输入焊盘以及 XTAL 振荡器本身的剩余焊盘。由于 GPU PCB 上的焊盘非常脆弱且走线极短,同轴电缆可能是理想选择,但会带来应力消除的挑战。作者在水冷块/散热器应用中使用了 SPDT 开关来减少应力并保持线短,而在液氮罐应用中使用了 JST-XH 连接器。使用 UV 焊锡掩膜进行应力消除。
  4. 连接与布线注意事项:将导线连接到连接器或开关。布线时需避免靠近任何电感器或 MOSFET,避免锐角弯曲,并尽可能保持导线最短。
  5. 安装电阻:在 Elmor ECB breakout 板上安装 20 欧姆 0603 串联电阻,并将信号和地线连接到同一块板上。

关键要点

  • 突破软件限制:NVIDIA 在 RTX 50 系列上收紧了 vBIOS 编辑和显存超频权限,迫使硬核玩家通过硬件修改(硬改)来挖掘性能。
  • 信号完整性是关键:GPU 的 PLL 对输入信号的波形(正弦波 vs 方波)、电压幅度(VPP)和频率极其敏感。外部时钟发生器产生的数字方波与 GPU 期望的模拟正弦波不匹配,导致严重的信号完整性问题。
  • 妥协的工程方案:最终可行的方案并非产生完美的信号
查看原文 →xtremesystems.us