小屿zzo 的讨论

发布于: 雪球回复:0喜欢:4
需求(无论训练还是推理)能不能带动集群。毕竟过去GH200 2560卡的集群,理论上需要3万多个光模块(当然HGX不需要这么多);而现在实现同等算力只需要最多500多张GB200(很可能更少...尤其是推理上),或者说8个NVL72机柜,IB这一层如果是1:3,那么需要1500个光模块....当然这里面会有到1.6T的价值量的提升。这里面是量减价升的。一方面价升能不能覆盖量减呢,最重要的是算力总需求还是很猛的话,这都不算啥。