DPU的前程是星辰大海

发布于: 雪球转发:0回复:2喜欢:4

算力正逐步成为新时代的核心生产力,算力的发展同步带动了网络的变革。过去很长一段时间,CPU主导了大部分算力市场,而随着人工智能应用的爆发性增长,CPU在图像渲染、并行计算能力不足的弱点被暴露出来。GPU(Graphics Processing Unit)的芯片架构更适合大规模AI模型训练和图像处理,成为了数据中心的第二大算力芯片。

然而随着5G、云计算的推进,数据量爆发式增长,CPU摩尔定律红利殆尽,实现卸载算力的DPU(Data Processing Unit)应运而生,定位于“第三颗主力芯片”。

什么是DPU?能实现哪些功能?

在后摩尔时代,数据中心网络传输速率逐步迈向100Gbps,使得DPU成为时代发展的必然。但DPU也不是横空出世,在智能网卡(Smart NIC)上早有端倪。简单来说,智能网卡的核心作用在于减轻CPU算力负担,相比于传统网卡(Traditional NIC)负责数据链路的传输、网络堆栈算法和协议,智能网卡承担了更多的存储、安全、网络的功能,使得CPU能够专注处理更重要的任务。

图片来源:2021智能网卡行业概览

那么DPU与智能网卡是什么关系呢?还要从DPU这一概念的来源说起。2019年英伟达花费69亿美元收购了以色列的芯片公Mellanox,随后将自身已有技术与Mellanox的Connect X系列的高速网卡相结合,于2020年推出两款DPU产品名为BlueField-2和BlueField-2X,从此DPU概念逐渐进入了公众视野。英伟达创始人黄仁勋总结了DPU的3个特点:卸载、加速、隔离。首先DPU卸载了数据中心网络服务(虚拟交换、虚拟路由)、数据中心存储服务(RDMA、NVMe)、数据中心安全服务(防火墙、加解密);其次DPU通过硬件实现并运行上述应用,达到“硬件加速”,运行效率成数量级提升;最后DPU不需要伴生于CPU,可以独立完成上述任务,起到了安全隔离的效果。总结来说DPU是以数据为中心构造的专用处理器,采用软件定义技术路线支持基础设施层资源虚拟化、存储、安全、服务质量管理等服务。

DPU功能实现的领域与智能网卡基本一致,这也是为什么博通称自己的泛DPU解决方案为Smart NIC。本质上来说,DPU相比于智能网卡并没有发生很大变化,但DPU可以用作独立的嵌入式处理器,也可以集成在智能网卡上。若非要区分二者,不如说DPU是智能网卡的扩展升级版。

为什么是DPU?

根据中国联通研究院测算,25Gbps带宽时网络处理消耗了50%CPU算力;50Gbps带宽时将消耗100%CPU算力;到了5G时代也就是100Gbps带宽时,将消耗超过150%CPU算力。因此CPU算力的增长速率与数据中心网络传输速率增长速度差距逐渐拉大,催生了协处理器的需求。同样为协处理器、甚至是AI算力核心的GPU不能承担起更多的任务吗?答案是否定的。GPU是执行规制计算的主力芯片,其在数据并行任务中表现突出,如图形渲染、深度学习、矩阵运算等。然而在CPU、GPU“双子星”格局中,CPU仍是主角,GPU是配角,具体而言GPU无法单独工作,仅当需要处理大量的统一类型数据时,CPU才会调用GPU进行并行计算,GPU更是一种伴生存在。

相比之下,DPU自带内核并拥有独立的操作系统,工作时不需要被CPU调配,还可以建立自己的总线系统,从而控制其他设备,无疑成为“异构计算”的主力。与CPU进行图形处理不够高效类似,其处理大量基础层应用也比较低效,例如网络协议处理、交换路由计算、数据压缩、数据加解密等,这些底层计算工作给了DPU极大的发挥空间,一方面实现了CPU的算力卸载,另一方面DPU更专注于数据处理,通过硬件加速提升了整个任务的工作效率。

图片来源:专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等

图片来源:中科驭数

DPU的应用场景

DPU的独立计算能力使其具备了更加丰富的应用场景,部分应用终端不用CPU只用DPU也可以满足需求。据赛迪顾问统计,2025年我国DPU市场将达到565.9亿元,5年复合增速达170.60%。目前来看数据中心仍是DPU最主要的应用场景,其中包含了互联网的云厂、非云厂、通信运营商、金融机构、信创等领域。互联网云厂商的需求最旺盛,2021年中国区DPU出货量中接近80%需求来自于云厂,预计未来几年DPU需求结构也会相对稳定。此外车载方案、交换机网络设备、特种行业移动场景都对DPU有着可观的需求。

DPU的未来

过去CPU既是计算中心也是网络数据处理中心,后摩尔时期网络带宽的增加,传统CPU的算力不堪重负。短期来看DPU将与CPU、GPU分工协作,其中CPU负责整个IT生态的定义及处理通用计算任务,GPU负责数据并行的任务如图形图像、深度学习、矩阵运算等加速计算任务,DPU则承担起安全、网络、存储等其它专用业务的加速处理。

图片来源:专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等

从更长的时间维度来说, DPU将成为核心引擎,推动数据中心基础架构的颠覆性变革,从以计算为中心转向以数据为中心。通过DPU提供的数据传输和分发能力,使得CPU、GPU、存储和加速器等可以在不同的位置或物理机上,各资源互相协同工作。数据转发不再需要CPU参与,DPU可以直接将数据送达GPU和CPU,时延上可以得到数量级的减少。

图片来源:专用数据处理器(DPU)技术白皮书

当前 DPU赛道中充斥了大大小小的众多厂商,其中不乏英伟达英特尔AMD博通这些芯片巨头,同时也有着互联网云厂和一批初创企业。但目前业界对DPU尚无明确的标准和定义,在9月2日第二届Smart NIC & DPU技术创新峰会上,参会企业都分享了自己的产品思路和对未来DPU发展的观点。尽管各家的DPU架构、定位不尽相同,但都是基于不同领域的实际需求所提出的解决方案。我们相信也期待着DPU将带来生态的发展、时代的变革。

互动送好礼

      即日起,我们会挑选每周优秀评论作者送上一本书。如果大家喜欢我们的文章,欢迎给我们留言,也是对我们的鞭策。

精彩回顾:

VR或将迎来百花齐放的时代

再谈半导体国产替代——从美国芯片法案说起

走向通缩与国家安全优先的新世界

7月新能源车零售量环比下降,混动车占比进一步提升

全部讨论

大跌的时候重仓,大涨的时候轻仓,你这是妥妥的拿着基民的钱接盘,现在成了缩头乌龟了

2022-09-06 08:44

亏那么多 不应该给一个解释吗