1.6T光模块及英伟达A800限售的近况

发布于: 修改于:雪球转发:6回复:13喜欢:33

核心要点:

1)1.6T的放量节奏

2)A800及国产算力的情况

3)交换机近况

(仅供参考,部分内容不一定对)

1. 北美服务器的配置和1.6T光模块的节奏?

海外的配置有A100、H100、GH200,只有咱们还有其他几个区域拿不到A100和H100、GH200,咱们还能用A800,比其他那几个强一点的。

他们GH200、H100都有,也配NVSwitch、InfiniBand,就不用单独配交换机了,直接就可以和英伟达配套的一些交换系统的方法来配,他也不是全部做满配置,比如用QM8700这类的交换机,它也是按照速率50%到60%左右配置。但它起点高一些,首先它400G、800G就很充分,大部分是配400G的为主。咱们主要配200G光模块和100G光模块为主。今年下半年,基本上再过一两个月1.6T的光模块都会发布了,支持1.6T的光交换机也会发布了,思科的,包括这个刚才讲英伟达QM系列类似的也有。

这样一来的话,到今年年底的时候,主流就会从400G、800G就这种配置模式会变成800G、1.6T那种配置模式,这是和咱们的一个区别。虽然也都是按百分之50、60这种半载能力来配置的,但是整体的起点速率高一些。那同时下半年1.6T会发布,肯定是北美最先用起来,这样一来的到下半年或者明年年初的时候,整个光模块和交换机的节奏要稍微快一点。

2. 1.6T光模块的量价趋势、1.6T与GPU的配比关系?

首先这个1.6T的价格开始就是今年下半年发布,到明年的Q2之前这两个季度肯定价格还是很高的,因为这咱们光模块行业这个规律就是这样的,当只有这两三家做的时候,价格很高。Lumentum、Avago还有Finisar就这几家来做。然后随着Broadcom重新进入这个市场。那么到明年的Q3、Q4左右,就是1.6T整个价格会有所下滑,它会带动800G的下滑。具体价格现在不好说,因为大家没还没发布,这至少是比两个800G的稍微便宜点。就咱们按历年他们新发布产品来说,基本上是两个800G光模块的1.7倍左右,1.7到1.8倍。

然后一般发布半年以后会降到1.6到1.7倍。然后发布一年以后基本上会降到1.5倍,它是这样的一个降价过程曲线。这样一来就是整个的这个市场就会以1.6T为主,从交换机数量,交换机背板数量以及背板的能力肯定也会高速提升,成倍的提升,来满足1.6T的交换能力要求。

然后从英伟达来讲的话,GH200发布,本身GH200里面是内嵌了1024个H100的核,本身的速度就相当快,他的自己的总线速度是7.2T。那所以就是1.6T发布以后会主要用在GH200,包括后面的比如说GH300,或者说他自己的下一代产品上。这样一来的话,就是从网卡,刚才讲的这种网卡或网络端口来讲,配置数量并不会减少,当然也不会成倍增加。因为整个的就是它的NPU速度会更快,当然你们如果把这1.6T的交换机的能力放在H100上边,或者说是用在咱们A800上边,因为H100它本身现在基本上不会再去上面去延伸成扩容,就是升级成1.6T了,就是800G、400G就够了。如果放在咱们A800上面,这块确实是能减少光模块的数量,刚才讲的每块卡给它配单通道双通道的这个800G。

如果是用这样的这个1.6T的话,基本上单通道1.6T就可以,但是做网卡很少做单通道的,基本都做双通道。双通道1.6T,那么就可以省出一些网卡空间来。刚才讲的NPU和网卡1:1的关系,那现在就不需要1:1了,就是相当于2:1的关系,就是稍微多空几个插槽来,会是这样的一个结果。

这样来讲的话,整个交换机那边就要提速,交换机整个也要换成背板和端口支持1.6T的才行。这块投资的话相当实际上还是在提升的,网卡的价值量变低了,但是这个交换机要提速,也能够支持48端口全速连接的这种1.6T,那这样的话价格也更高了。所以这样一来网络交换设备的这种投入量其实也是更高了。

那这块还有一个问题,就是虽然今年下半年1.6T会马上发布,但是在咱们市场上1.6T可能要到明年才能够真正用起来。800G刚出的时候,包括以前400G刚出的时候,也都等了一年多。

北美明年Q2Q3要考虑降价的问题,那么国内的话可能要到明年Q4左右。800G、400G这个受价格影响要1.6T进来以后才会有这种降价的动作。

3.Al训练这块交换机市场头部几家公司的市场份额?

也是分国内和北美,英伟达占据了Al训练市场的百分之80以上,基本上大部分都现在都用CUDA的平台来做。所以那个市场基本上是NVswitch,QM系列的交换机为主,然后加上一些数据中心的存储阵列的管理,这些就是以思科为主的。

我们没有NVswitch,所以做Al训练比例第一的是新华三,第二是H,占比较高。这两类的交换机加起来基本上占了这种大规模训练的60%左右市场,还有30%左右的就是思科。然后剩下的还有一些其他品牌交换机,但是其他品牌交换机能背板速度超过2.4T,达到4.8T,甚至更高的并不多,所以基本上90%左右市场被刚才讲这三家占据了,那么新华三和H主要占领的是信创市场,包括配套做训练的这些。还有一部分企业市场,就是BAT这样的市场。思科基本就是在咱们互联网市场里面的,比如字节、阿里腾讯,这样的市场为主。

3.国产算力芯片,像沐曦、燧原下一代的大芯片算力上也做得不错。有传出A800可能会受影响,基于公开信息,整个产业会怎么应对发生这种问题,以及国产的这些芯片能否赶上来?

首先这个事情一直在争执,本来去年的时候A100、H100发布的时候,大家好多企业没着急买,然后觉得等一等,基本上等两个季度左右会降价,所以都等一等。后来一说可能买不到,大家就赶紧抢A800。这个事情英伟达也是不得已而为之,对于他来说,那么大的市场,那几十万颗的需求量对于他来说也是不小的,所以只能做个低配版能够许可的这样来卖。从后面来讲,大家也都传A800、H800有可能会有影响,这个事情是很有可能发生的,这点不否认。

至少在咱们自主这个圈子里面,大家是水平是一致的。同时能够帮助壁仞、寒武纪、海思、平头哥这些芯片继续成长,大家买不到A800或H800的时候,只能买国产的。那这个时候国产的这些20多家做NPU做得还不错的,那这些企业大家就有机会了。包括在这个基础上的算力模型也会变化,因为大家以前都按照CUDA都跟着英伟达来做,跟着英伟达的平台来做的就是大家代码都是一样的,竞争力也弱,说白了大家都是去GitHub上找一段相应用的这种算法代码或者优化代码,然后拿过来就用。那大家就是同质化竞争,最后就拼价格。

其实看咱们原来的电子行业,很多产品,包括电视机、空调、冰箱、洗衣机都是这样拼价格拼出来的,因为大家同质化,在架构设计都一样。那么当国内的这些NPU厂家开始各自有独立空间的时候,那这些新的算法或者独立开发这些算法就有机会了。拿CUDA的算法,你在寒武纪上面可能跑起来,那比如在壁仞上,再比如在昇腾上跑起来就很困难,架构不一样。昇腾是在Caffe上面找的这个MindX的一种架构。那这样就跑不起来。那在国内的系统上就有新的机会了,各种算法、各种推演感性的算法在这个机会上就跑了。当然这是个人观点,就是大家能互通有无是最好的,这个取长补短。当A800或H800没了以后,那么整个的架构,高算力架构和Al推理训练的架构会发生变化。

所以就是A800、H800如果有影响,咱们也有也是有办法来解决的,并且反倒是一个促进作用。

4.交换机里面到底核心零部件有哪些?哪些东西占比较高?供应商大概是谁?

交换机就是两大类芯片的供应商,它核心是一个是交换芯片,一个是这个光电收发器,光电收发器实际上是在这个光模块里面。交换芯片两大类,第一大类就是Broadcom。采购博通的包括新华三这些。另外一类就是用国产的ASIC的。

在一个交换机不配光端口、不配光模块的情况下,这个主处理芯片加主处理版,基本上占一台汇聚交换机整个成本的大致30%左右,30%-35%。一台汇聚交换机上万块钱。里边有3000多是这个这颗芯片。

当然还有很多是RAM和Flash,类似于内存硬盘它也要配置很高,内存和硬盘的话加起来内存占15%左右,Flash基本上也占到15%左右,那等于这两块加起来就占到了60%多,而且是不带光模块的。光电收发器就是咱们说的光电转换的那些半导体,它加上这光电激发器,那这块基本上占到了80%左右。

所以这两个芯片占它一台交换机的整个的BOM基本上45%左右。然后它本身配的RAM和Flash也是很大的,为了整个全速交换提高交换能力,所以在RAM和Flash,RAM基本上占了20%,Flash也占了15%左右。

光模块的封装形式是QSFP56,咱们大部分用的光模块是28,相当于咱们两个光模块并在一起的大小,这块的话整个成本BOM是差不多的,只不过是它封装体积大一些,然后这样的为了它这菊花链的连接更加方便,更加清晰而设计的。这是交换机和光模块的主要的BOM成本。所以如果讲光模块国产替代的话,只能在封装上替代,就是光半导体这块替代还很困难。那当然交换机这块生产工艺来讲,新华三都有这个能力,就只要能拿到芯片都可以做得出来。

5.PCB在一个交换机里的价值量、成本占比是多少?

基本上12层、20层的高频高速的PCB在交换机里面的价值量不一样,有高有低。如果就拿8和9系列的这种比的话,在里面基本上占到百分之七八左右。相当于按5万美金乘以40%就是2万美金的,百分之七八就是1000多美金。因为它的本身速率快,它要支持4.8T、7.2T的交换能力。一般服务器也就2.4T的交换能力,所以它确实是比服务器的门槛也稍微高一点,价值量也是高一些。

精彩讨论

拉萨带头人2023-08-05 13:51

第一感觉写了好多东西,应该是业内人士写的!通篇看一下就是记流水账,毫无重点,也不知道想表达的是什么!也许人家只是业内人士叙述了一下现状!复制黏贴的感觉很浓烈!感觉楼主完全是为了完成任务,没有自己的消化和理解!

迷呜2023-08-05 13:45

剑桥科技是不是调整的差不多了,老师

诸葛村夫r2023-08-05 14:17

风来了……周一起飞

惚如远行客2023-08-05 14:06

现在才开始理解AI?

全部讨论

2023-08-05 13:51

第一感觉写了好多东西,应该是业内人士写的!通篇看一下就是记流水账,毫无重点,也不知道想表达的是什么!也许人家只是业内人士叙述了一下现状!复制黏贴的感觉很浓烈!感觉楼主完全是为了完成任务,没有自己的消化和理解!

2023-08-05 13:45

剑桥科技是不是调整的差不多了,老师

2023-08-05 14:17

风来了……周一起飞

2023-08-05 14:47

不管800拿不拿得到,最优选是保底扶持一批国产企业以保证自主可控。HWJ,HW,HG以及一些独角兽都有机会

2023-08-05 14:11

沪电股份

2023-08-05 14:02

思林杰给思科供检测仪器和设备,就是查不到收入占比

2023-08-08 14:59

//拿CUDA的算法,你在寒武纪上面可能跑起来,那比如在壁仞上,再比如在昇腾上跑起来就很困难,架构不一样。昇腾是在Caffe上面找的这个MindX的一种架构。那这样就跑不起来

2023-08-08 14:58

//所以基本上90%左右市场被刚才讲这三家占据了,那么新华三和H主要占领的是信创市场,包括配套做训练的这些。还有一部分企业市场,就是BAT这样的市场。思科基本就是在咱们互联网市场里面的,比如字节、阿里、腾讯,这样的市场为主。

2023-08-06 20:13

证券地产这块刚歇一歇,AI的消息就明显增多了。是不是太明显了?

2023-08-05 14:01

老师 半导体还是先看算力和存储吗