确定性网络必须攻克远距离无损传输技术,这是华为中兴的主要研究领域

发布于: 雪球转发:0回复:0喜欢:1

每个芯片在互联网能力方面大大提升,所以GPU算力跟网络带宽的需求量增长速度,对网络带宽的需求量会急剧增长。

中国工程院院士刘韵洁:确定性网络必须攻克远距离无损传输技术

C114讯 5月22日消息(岳明)在昨天举行的“GIIC——2024 GPU Infrastructure Innovation Conference暨第四届中国IDC 行业DISCOVERY大会”上,中国工程院院士、紫金山实验室荣誉主任兼首席科学家刘韵洁应邀出席,并发表《确定性网络为AI大模型发展提供重要支撑》主旨演讲。

刘韵洁指出,互联网在消费领域取得了巨大成功,但随着向生产领域和实体经济的逐渐渗透,传统互联网“尽力而为”的网络能力已经很难满足需求,确定性是下一代网络必须面对和解决的问题。这种确定性不仅仅是实体经济和AI人工智能的需求,在消费互联网中也需要。以苹果推出的可穿戴电子设备产品——Apple Vision Pro为例,有12个摄像头,5个传感器,6个麦克风,可以在12毫秒内把一幅高清图像展现在面前,而这就需要确定性网络能力。

在大模型领域,大模型对算力的需求更为迫切,2012年到2023年,算力需求增加了数十万倍,最近五年GPU的算力增加了90倍,但整个网络的带宽才增加了10倍,这个差距现在预示着将来对整个网络带宽的能力、通讯能力提出更高要求,缺口会越来越大。

数据要素确权也是个重要应用领域,怎么把数据要素利用好、管理好,把安全性保护好是非常具有挑战性的问题。没有数据要素,中国在AI方面也会遇到很大的障碍;如果不能对数据要素进行很好的隐私保护和防护,这些数据要素就没法共享,没法流通,AI的发展就会遇到障碍。

另外,在大算力时代,分布式算力是必然选择,“不可能集中在一个地方来做算力,电力问题就解决不了。”对此,我国提出了“东数西算”的布局,但如何把这种算力布局服务到全国各个行业、各个大模型?网络问题怎么解决?这就面临一个很大的挑战——怎样实现远距离无损的传输?

刘韵洁指出,远距离无损传输是一项必须攻克的难题,其中RDMA是一种非常关键的技术,微软的算力中心70%都是采用RDMA无损协议进行互联。华为的试验数据显示,100GE环境下,8节点VGG16模型训练RDMA性能是TCP- IP协议的8倍多。“因为AI高端芯片对中国的封锁,中国单点算力的差距跟美国会越来越大。在网络能力方面,英伟达GB200相较于H100又有了成千上百被的提升,说明什么问题?每个芯片在互联网能力方面大大提升,所以GPU算力跟网络带宽的需求量增长速度,对网络带宽的需求量会急剧增长。”

结合该文,再来看看之前中兴通讯的内部刊物的发文:

中兴通讯RoCEv2网络端网协同创新方案

传统DCQCN网络因其拥塞标记信息粗略和端侧与网络侧流控机制的相对独立,难以在高吞吐、满负荷的网络环境下避免拥塞、丢包和时延等问题。为提升高性能网络的传输性能,中兴通讯提出了RoCEv2网络端网协同创新解决方案,通过端网协同联动机制实现精准、快速的拥塞控制和流量调度算法,使网络的吞吐率提升到90%以上(见图1)。该方案在拥塞控制和精准流控两个方向实现端网协同创新。

端网协同新型拥塞控制技术

网络设备通过快速CNP和带内遥测技术及时准确的向端侧提供链路拥塞信息,实现新型拥塞控制技术。

- 快速CNP技术

传统DCQCN网络,当网络设备出现拥塞时,相关链路的数据报文会打上ECN标记,目的端网卡收到ECN标记报文再向源端网卡发送CNP报文,源端接收到CNP报文后进行调速,该过程周期较长,调整速率响应缓慢。我们提出快速CNP解决方案,中间交换机检测到拥塞时,会迅速向源端网卡发送包含详细拥塞信息的CNP报文,源端网卡能更快地利用这些信息精准调整流量,从而迅速缓解网络拥塞。

- 基于带内遥测机制的精准拥塞流控技术

传统DCQCN中的ECN拥塞指示只有1bit,无法精确表达链路拥塞程度,源端也就无法进行精准流量调控。我们提出了基于带内遥测技术携带更多路径负荷信息的解决方案,中间设备在遥测报文中填充可用带宽、队列深度、时间戳、发送字节数等信息,端侧收集齐路径所有网络设备的遥测信息后,根据训练调优后生成的流量调度算法对流量进行实时精准调控,使端到端路径流量达到高吞吐、低时延、无拥塞的最佳状态。

端网协同多路径精准流控技术

网络侧与端网配合,充分利用RoCEv2网络ECMP路径和多种负载均衡技术,提升数据传输效率。

- ECMP路径端网协同通告

AI大模型训练数据中心的RoCEv2网络采用胖树CLOS架构,拥有丰富的ECMP路径。RoCEv2网络控制器掌握全网拓扑,并向端侧同步ECMP路径信息,以优化数据传输,提升网络效能。

- 根据流量特征匹配的负载均衡技术

端侧根据流量特征(如老鼠流、大象流)选择不同的负载均衡技术,通过报文哈希或源端口散列进行选路,并可根据网络负载实时调整策略,以提升数据传输效率。

随着AI大模型参数从千亿迈向万亿,以及AI芯片算力供给受限,万卡规模的智算集群网络成为必然,大规模组网场景下的精细化端网拥塞控制成为业界亟待解决的共同挑战。中兴通讯提出的RoCEv2网络端网协同创新解决方案,旨在改进网络的吞吐率,强化AI大模型训练网络性能,进一步释放AI算力,提升AI大模型训练效率。

关于六院士提到的RDMA与中兴通讯的解决方案中的RoCEv2的关系如下,习惯性的用了一下Kimi

国内只有华为和中兴通讯是真正的全栈解决方案提供者!数字时代,算力时代,没有中兴通讯的位置?坚决与狗庄斗争到底!!![怒了][怒了]