DC短距光通信:CPO简述

发布于: 修改于: 雪球转发:4回复:51喜欢:57

一、why

在数据中心网络中心,光模块已经反客为主:

过去一个不起眼的小角色,华丽逆袭,成为整个投资占比达到80%~90%的老大哥。你要过去的cisco、arista、broadcom、…,一众大佬怎么活?

但是,过去的大佬,还是颇有绅士风度,不是简单地同质化竞争,而是挥舞技术升级大棒追打。核心就两点:功耗+带宽。这也是AI集群的核心痛点,确实精准发力。

光模块确实碰到硬茬了。

二、What

要革光模块的命,充分性和必要性,都清楚了,那为什么是CPO呢?

光通信的功耗,分两部分:1)将电信号传输到光引擎的损耗;2)光引擎自身的功耗。对于第二部分,不管是Pluggable、LPO还是CPO,只要光传输的距离相同,功耗完全没有区别。功耗的区别只有第一部分。

而第一部分的功耗,来自为了克服高速电信号在传输线上的损耗。从上面的图表可以看出,信号速率越高,损耗越大,那么功耗就会越大。所以,要降低损耗,最好的办法,就是把光引擎无限靠近芯片的裸die,于是,就有了下面的形式:

三、How

CPO的终极方案是C型,目前比较成熟的是A型和B型CPO:2.5D封装版本的CPO。属于比较入门级的3D封装体系,Switch ASIC和OE(光引擎)都是独立的部件,合封在一块package基板,如图:

Intel的产品结构图(注意,博通的Switch ASIC,Intel自家的硅光OE):

理论上讲,芯片是芯片,光引擎是光引擎。虽然很多芯片厂家也在做硅光引擎,但还各是各的市场。并且,pluggable采用硅光技术后,里面的OE,跟CPO的OE,就是同一个部件,没啥区别,底层技术是通用的。比如博通

所以,有一个很重要的推论:

CPO大规模商用后,Pluggable光模块的市场空间会萎缩,但掌握硅光技术的龙头企业,受益于CPO普及带来的数倍增量空间,将获得二次腾飞。

当然,这里面有一个至关重要的命题:博通Intel英伟达思科这些震耳欲聋的业界大佬进军CPO,中际旭创新易盛这些中国的小龙有翻身的机会吗?

要回答这个问题,必须先回答另外一个关键问题:CPO技术做了这么多年,博通甚至做了三代产品,为什么还没有规模商用

下表是一次学术会议的PPT:

光模块的故障率,是AI集群系统影响可靠性的第一因素,大概会导致30000ppm的故障率,而ASIC芯片呢,普遍只有700ppm左右,相差40多倍。另外,做成CPO后,相当于原来32~64支可插拔的光模块绑定在一起,只要有一支坏掉,必须把另外35支对应的服务器全部下电后进行更换,等效为故障率放大35倍。对于原本就是罪归祸首的部件,把故障率再放大35倍,谁吃了豹子胆?

所以,那些AI集群建设的loser(博通、Arista、思科)们,光脚的不怕穿鞋的,吹牛逼不需要承担责任,一个劲的猛推CPO。

而真正要负责的那些厂家,承担AI集群建设的英伟达、互联网厂家们,则谨慎得很多,技术上他们很高调,但商用部署一推再推。

越是完美的东西,越难获得。比如光伏里面的钙钛矿电池、锂电中的固态电池,太完美了、太理想了,以至于一直存在于桃花仙境中。

另外,既然CPO可梦不可得,那么退一步海阔天空,大家就想着用LPO来解决问题:

当然,LPO也有很多问题未解决,尤其是200G/λ的LPO,到目前为止尚未从技术上找到答案。Pluggable模块虽然各种各样的痛点缠身,但地位一直牢不可催,因为它的那些毛病,客户花钱可以解决,而它的优点,其它路线花钱也买不到。

总结:

1、CPO技术是pluggable光模块的下一代技术平台,这一天迟早会到来。就类似于固态锂电池迟早会替代液态锂电池;

2、光通信的故障率是AI集群失效的首要因素,在CPO的可靠性没有做到100x级别提高前,商用的前景不乐观

3、在硅光平台下,CPO、LPO、Pluggable共享底层光引擎平台,那些率先大规模量产硅光技术、可靠性经受市场检验的公司,将具备明显先发优势

4、CPO是其他技术手段穷尽后,最后的选择。这句话我以前讲过,现在再讲一遍。

$上证指数(SH000001)$ $罗博特科(SZ300757)$ $中际旭创(SZ300308)$

精彩讨论

闷得而蜜06-09 23:41

中际旭创老老实实把领先的硅光平台做好,做出量来,通过海量的运行数据,把可靠性的量化指标,清晰呈现在各个客户面前,比在各个媒体、技术论坛上吹牛逼,好一千倍。
CPO时代,中际旭创能够拿得出手,就是经过检验的可靠性。这也是他在CPO领域再次引领的不二法门。好好珍惜。$中际旭创(SZ300308)$

heiheiheihahaha06-10 11:56

说这些真的很无聊,过两天发篇深度就都清楚了

闷得而蜜06-09 23:31

对于罗博特科的硅光设备,我并不看空,但也不确定性地看多。他的技术和产品肯定是领先的。CPO还存在很大的不确定性。如果你说他是一支好票,则明显不符合事实。当做一支高弹性的风险票去博弈,这个定位更合适。$罗博特科(SZ300757)$

闷得而蜜06-10 11:41

谁给你灌输“LPO也有短板,就是它的封装产品只适于短距离,长距离还得 CPO” ? 距离跟Pluggable、LPO还是CPO没有任何关联。

闷得而蜜06-10 11:09

国内的光模块生产线,由手工向自动化转型,也是确定的方向,硅光渗透率上去后,这个进程会加速。利好罗博科特,利空天孚通信。

全部讨论

对于罗博特科的硅光设备,我并不看空,但也不确定性地看多。他的技术和产品肯定是领先的。CPO还存在很大的不确定性。如果你说他是一支好票,则明显不符合事实。当做一支高弹性的风险票去博弈,这个定位更合适。$罗博特科(SZ300757)$

06-09 23:41

中际旭创老老实实把领先的硅光平台做好,做出量来,通过海量的运行数据,把可靠性的量化指标,清晰呈现在各个客户面前,比在各个媒体、技术论坛上吹牛逼,好一千倍。
CPO时代,中际旭创能够拿得出手,就是经过检验的可靠性。这也是他在CPO领域再次引领的不二法门。好好珍惜。$中际旭创(SZ300308)$

多谢分享,如果是cpo时代不应该是交换机厂商直接把Asci和OE一块儿做了然后封装在一块板子上吗?旭创在CPO时代设计OE,然后台积电或者GF那边把旭创的OE Die和博通的Asic die最后都封装在一起吗?很难想象如果是基于硅光技术,为什么不是博通自己把所有的活都同时干了呢,这样一致性和兼容性不是更好吗?能设计TPU的博通设计个OE不相当于陈景润做小学数学题吗?实在理解不了CPO时代独立硅光引擎厂商存在的价值

老师,剑桥科技还能持有吗?中际破新高的话,剑桥有没有机会反弹一波呀,谢谢!

06-14 06:18

请教一下,一台服务器有多个光模块,坏一台CPO交换机影响大么?集群还是能正常工作不是?

06-14 04:08

感谢闷总分享。请问同为光模块的aaoi还有机会吗?

06-12 09:21

1

06-11 22:27

密总,这些技术路线,是不是都要用到MT和MPO插芯,是不是致尚科技的光模块插芯还可以起飞

06-10 11:30