AI算力基建:光通信从快周期到高成长的蜕变

发布于: 修改于: 雪球转发:3回复:33喜欢:45

过去,光通信被视为一个快周期行业。它的发展受到市场需求和技术更新的快速推动。随着数据流量的爆炸式增长,数据中心对光通信的需求也呈现出阶段性的高峰。

一、光通信周期性特征的成因

A 股的中际旭创天孚通信新易盛光迅科技等专业的光通信企业,都呈现明显的周期性特征。以中际旭创举例:

技术迭代周期:数据中心光通信技术的更新换代遵循一定周期规律,从早期的单模光纤到DWDM(密集波分复用)技术,再到当前400Gbps乃至更高速率的光模块的应用,每一次技术进步都推动了行业的繁荣与发展。新技术的研发、标准化、商业化推广及应用部署通常会有4~5年的周期,从而形成行业上升和调整阶段。

网络建设周期:数据中心的建设和扩容通常与互联网服务提供商、云服务商的战略规划紧密相关,尤其是大型数据中心集群的构建。当新的网络架构(如5G、6G)或新型业务模式(如边缘计算、AI应用)兴起时,会引发新一轮的大规模数据中心光通信基础设施建设,这一过程往往呈现周期性特点,例如4G网络建设周期约为6-7年,5G网络建设周期可能会有相应的变化。

二、Scaling-Law和Moore-Law剪刀差,周期变成长

在深度学习和大型语言模型(LLMs)的研究中,Scaling Law 描述了一个关键现象:当模型的大小(例如参数数量)、训练数据集大小以及训练过程中的计算量(如浮点运算次数)按比例增加时,模型性能(如准确率、困惑度、BLEU得分等)通常也会随之改善。

通俗地讲,Scaling Law揭示了一个道理:参数量、数据、算力这三要素,如果固定其中的一个,只改进另外两个,都有增益上限。人类通往AGI的道路上,必须同时持续地提升这三个参数。

随着工艺越来越逼近物理极限,摩尔定律渐微,从Nvidia的芯片从H100开始,每一代芯片,单位面积的性能提升不到15%,并且往后演进3nm、2nm、1nm每一代的红利收益均不会超过15%。未来二十年的主要矛盾是:半导体工艺无法满足AGI日益增长的算力需求。怎么办? 系统施策,俗称摊大饼,将成为提升算力的主要路线:a)持续加大HBM内存容量;b)持续提升互联带宽,从而提高GPU的并发度;c)持续提升集群规模,从而提升系统容量;d)持续提升散热能力,给摊大饼创造条件;…

AGI算力基建在Scaling-Law和Moore-Law的剪刀差中艰难前行

1、需求曲线,遵循Scaling-Law,AGI需求呈指数级增长(10x)

2、供给曲线,遵循Moore-Law,IT硬件的成本下降速度遵循幂律(½X)

摊大饼,首先要建立大饼之间相互通信的高速公路。互联(interconnect、intraconnect)成为AI cluster各种部件之间的核心枢纽,光通信是缓解Scaling-Law和Moore-Law剪刀差而必须发展的先导性产业,光通信迭代速度,很大程度上决定着AI算力基建的进程

三、AI集群,光通信乌鸡变凤凰

DCI:因为GPU 的功耗越来越大,单POD cluster的能耗动辄百万kw,甚至数百万kw,如果AI集群集中部署,会给当地能源供应造成巨大的压力,所以,AI集群呈现分散化部署的特征,而这些分散的集群之间需要长距离的相干光模块连接起来。

DCN:随着大模型的参数量越来越大,单GPU的算力越来越强劲,AI集群规模也越来越大(Google微软规划100万GPU的超super cluster)。集群既要提速,也要扩大规模,驱动光通信从速率和数量两个维度增长。

CPO/OIO:另外,随着AI集群的重点从训练向推理过渡,GPU之间通过高效率、高通量的NVLink等底层互联技术,实现内存一致性访问,几十数百个GPU拼接成巨型单node GPU,成为提升推理性能的关键手段。由于铜线互联有明显的速率上限,无法持续演进,CPO、OIO的低延迟、高带宽密度和低能耗特性,使得光互联成为不二之选。Chip to Chip互联即将成为光通信的下一个蓝海。

思科在OFC会议期间的投资者交流会上坦诚,数据中心网络的投资结构,10G时代,交换机和光模块的比例分别为90%、10%,而到了800G时代,交换机vs 光模块为 20% vs 80%,完全颠倒过来,并且光模块的占比在持续提升。

所以,投资光模块,等同于投资数据中心网络

巨大的需求驱动光通信的技术迭代周期从5年一代,提升到2年一代。结合2024年OFC大会、专业研究机构、海内外投行的分析报告,测算2024~2028的五年间,AI集群光模块市场,将实现CAGR 40%的持续增长。若把电信光通信、传统Cloud DC的光通信算进来,到2028年光通信将达到$500亿的大市场,妥妥的脱变为一个高成长的行业,蛋糕足够大。

A股的龙头企业,全面参与全球的AI集群光通信市场,中际旭创的营收预计从2023年的110多亿,到2028年将超过800亿。新易盛的营收也将达到200亿以上。

$上证指数(SH000001)$ $天孚通信(SZ300394)$ $中际旭创(SZ300308)$

FAQ:

Q1:未来随着硅光集成度越来越高,在CPO、OIO时代,应该是芯片厂商+Fab占据主导地位了,光模块厂商的竞争格局/市场前景确实难说?

A:AI数据中心的光模块应用市场分层的,必须分开看。

1、DCI、DCN、AI Cluster中以太网或InfiniBand的互联(也就是目前光模块的市场范围),因为组网、配置的多样性,以及成本、供应多样性等考虑,另外这类互联的带宽密度和功率密度都还有很大的设计空间,所以即使在CPO、OIO商用后,继续以Pluggable的形式存在,相关的市场空间继续受益于AI增长而增长,不存在颠覆的可能。

2、CPO/OIO开创的全新C2C光互联市场,CPO与OIO还是有点一定区别。

3、ASCI和CPO之间也是解耦的,机会向光模块龙头企业开发,因为其硅光技术先在pluggable模块应用成熟,他们进入这个细分市场具有一定的先发优势,他们通过提供CPO模组的方式,参与这个新的蓝海市场。

4、OIO更进一步,与ASIC die之间3D封装,芯片+Fab主导的可能性更大。

总结,悲观的预期是全新新增蓝海没有了,只能把原来的蛋糕做大做强;乐观的预期是,一方面做大做强原蛋糕,同时开创一个10x大的C2C蛋糕

Q2:C2C市场,铜线vs光纤,哪个成功的可能性更大?

A:铜线互联的有点是功耗低,成本不高,但是带宽达到212Gbps后,再提升的难度非常大,而光通信基本没有上限,随需求和技术持续升级。未来的趋势肯定是铜线PCB->铜缆->CPO->OIO。硅谷最近两年CPO、OIO相关Startup公司如雨后春笋般冒出,博通MarvellNvidia等巨头投入巨资攻关,既可佐证。

Q3:光模块巨大的市值前景,势必牵引更多厂家进入这个市场,快速将蓝海变红海,重蹈新能源产业的覆辙?

A:这种担心有一定道理。中国市场的光模块厂家其实非常多,但真正进入AI集群的厂家很少。即使是一线供应商,比如新易盛,在第一轮比赛中800G也没有入围。原因有:

1、技术迭代加快,五年变两年,新产品层出不穷,基本没有稳态的窗口期,二、三线跟不上;

2、客户比较集中,一般不敢贸然扩产,需要订单支撑才能投入资本开资,这样实际不会出现过剩产能的情况;

3、光模块具有通信设备的属性,互联互通很关键,后来者很难突破存量龙头的格局;

4、光模块只占算力基建的5%,但稳定性、可靠性等质量代价具有全局性,5%影响100%,客户的痛点更多在可供应性、稳定性、可靠性,软性门槛很高。

Q4:国内的AI Cluster市场空间怎么看?

A:只要国内的AI大发展,就必须大规模投资AI算力基建,光模块的市场增量空间肯定也小不了。但是,国内的光通信技术路线会慢海外一代,享受海外市场催熟的红利,供应链比较成熟,竞争会更加激烈,毛利和净利润都需要降档考虑。

Q5:AI算力主权驱动非美市场快速增长,光通信是否会享受这些红利?

A:肯定。AI集群的技术体系基本由GPU厂商主导,比如Nvidia的解决方案就在NVlink和InfiniBand两种架构下建设,那么对应的光模块也势必有Nvidia主导,产业链等同于北美市场。

Q6:光模块市场主要在北美,地缘政治风险如何考虑?

A:地缘政治因素确实是关键风险之一,会受到一些关键事件的影响。不过,即使在2018、2019年,光模块的关税也只有7.5%,并且全部是客户自己承担。 我国经过20多年的发展,光通信产业在全球都有比较优势,80%的光模块都在大陆研发、 生产供应,另外20%的大部分,也属于内资的外延。中美之间形成了较为良性有序的上下游供应关系,合作大于竞争。限制大陆的光模块产业,会严重影响北美人工智能产业的发展,所以,这种风险心理因素大于真实情况。

Q7:光模块虽然市场前景广阔,但还是一个小产业,从投资的角度看,是否很容易导致交易拥挤,从而失去可投资性?

A:A股的光通信相关产业其实不小了。根据中证光通信主题指数的样板股,即使把三大运营商拿掉,市值总规模已经突破一万亿。

精彩讨论

闷得而蜜04-07 20:06

很多人对海外AI算力中心分散化的趋势还不理解。主要原因是中国的电力太好了,全国一张网,容易调度,大家就把中国映射到海外。 美国、欧洲、东南亚这些地方,电网都是私营的小网,几个火电站就搞一张网,弹性很小的。你要扩容,需要繁琐的各种手续,以年为单位,所以,你太集中的话,他就受不了。$上证指数(SH000001)$ $中际旭创(SZ300308)$ $工业富联(SH601138)$

只做三好学生04-06 19:53

Q6:光模块市场主要在北美,地缘政治风险如何考虑?
这一点实际上蜜 大自己已经回答了:"4、光模块只占算力基建的5%,但稳定性、可靠性等质量代价具有全局性,5%影响100%,客户的痛点更多在可供应性、稳定性、可靠性,软性门槛很高。",英伟达毛利90%拿走了,美国会限制你替它打工吗?

全部讨论

04-07 20:06

很多人对海外AI算力中心分散化的趋势还不理解。主要原因是中国的电力太好了,全国一张网,容易调度,大家就把中国映射到海外。 美国、欧洲、东南亚这些地方,电网都是私营的小网,几个火电站就搞一张网,弹性很小的。你要扩容,需要繁琐的各种手续,以年为单位,所以,你太集中的话,他就受不了。$上证指数(SH000001)$ $中际旭创(SZ300308)$ $工业富联(SH601138)$

04-06 22:34

果然是把CPO的问题放在第一个,目前是唯一一个需要担忧的点。后面的问题都已经化解。

其实要担心的就是别人预判了你的预判的同时你也预判了别人的预判,资本市场就是这样,一将功成万骨枯

学习

04-06 20:33

请教一下
1. C to C的板间互联会不会是天孚这种做光器件的公司机会更大?旭创和新易盛这种做光模块的是不是成功的概率远不如天孚这种光器件公司?
2. 如果是博通的板上CPO方案,可插拔光模块的应用场景在哪儿?不都是交换机上就全部解决了吗?

Q6:光模块市场主要在北美,地缘政治风险如何考虑?
这一点实际上蜜 大自己已经回答了:"4、光模块只占算力基建的5%,但稳定性、可靠性等质量代价具有全局性,5%影响100%,客户的痛点更多在可供应性、稳定性、可靠性,软性门槛很高。",英伟达毛利90%拿走了,美国会限制你替它打工吗?

04-07 08:27

可以聊聊硅光的罗伯特科吗

有消息称,cpo可能25年就开始小批量商用,27年量产

04-07 22:12

A股的龙头企业,全面参与全球的AI集群光通信市场,中际旭创的营收预计从2023年的110多亿,到2028年将超过800亿。新易盛的营收也将达到200亿以上。
学习了,坚持那三年。

04-07 14:39

我上一次看到这种类似的题目,还是那个谁在吹磷化工三杰,从周期到成长,后果大家也看到了,在产业周期顶点吹转成长的,我劝你多留个心眼。