英伟达NVLink 交换芯片升级:HGX B200

发布于: 雪球转发:0回复:0喜欢:0

芝能智芯出品

英伟达推出了最新的HGX B200主板,标志着其NVLink交换芯片的重要变革。

Ingrasys展位上展示的一块裸露的HGX B200主板吸引了众多目光,主板展现出巨大的设计变化,特别是在NVLink交换芯片的配置上,从四个减少到两个,并且位置转移到了主板中央,对于GPU互联架构和数据处理效率具有深远影响。

Part 1

NVLink交换芯片的演变

NVIDIA的8-GPU基板技术从P100/V100时代开始逐步发展。在P100/V100时代,8路SXM基板上主要使用PCIe交换机,GPU之间通过NVLink连接。

在2018年DeepLearning12项目中,技术团队需要自行安装散热器,当时的基板由技嘉制造。这一过程不仅复杂且成本高昂,还需要精确的工具和技术,以避免损坏昂贵的P100 GPU。

英伟达HGX-2主板的推出,NVLink Switch芯片(当时称为NVSwitches)被预先集成到系统中,极大地简化了安装和冷却过程。

在A100时代,NVLink Switch/NVSwitch散热器变得更大,但整个HGX A100平台由NVIDIA制造并预先组装好,提供给供应商使用。进入H100时代,四个NVLink交换机位于HGX H100底板的一端,进一步优化了系统设计。

Part 2

HGX B200的创新设计

HGX B200主板带来了令人瞩目的改进。NVLink交换芯片从四个减少到两个,并且位置从底板边缘移到了中央。这一设计变动不仅减少了走线长度,优化了信号传输,还可能带来更高的性能和稳定性。

新的NVLink Switch芯片被证实比之前的版本更大,移到电路板中央有助于减少信号延迟和提高数据传输速率。此外,HGX B200底板上的PCIe重定时器也采用了更紧凑的散热设计,进一步优化了整体散热管理和能效。

随着AI、深度学习和高性能计算需求的不断增长,GPU互联架构的优化变得至关重要,新的HGX B200主板提升了系统的性能和效率。

小结

英伟达的硬件层面创新对整个AI服务器产业的带动作用很大,细节层面我们持续跟踪。