gen-AI时代向规模化演进的投资机会

发布于: 雪球转发:15回复:137喜欢:79

注:作为近期小节,本文主旨大抵来源于雪球网友们讨论,并启发收束于一篇雄文(评论附链接)。

现实背景:chatgpt引爆gen-AI,LLM成为通向AGI的可能。越早摘得AGI果实的玩家获得越大奖励,军备竞赛开始。根据scaling law,玩家们无止境渴求加速计算算力。易得:

1、更大的角度上,持续而规模巨大的加速计算算力需求,让训练LLM的主战场只能集中于数据中心/云端,换言之,这是一场关乎【数据中心】的军备竞赛。

2、稍具体的角度上,加速计算需求猛增,而芯片摩尔定律失速,二者之间矛盾凸显。单芯片加速算力不足,又鉴于LLM对存算带宽的迫切要求,GPU厂已在通过chiplet/增大带宽等各种办法来应对需求,下一步如何系统级规划集群架构成为关键。

有鉴于此,先看英伟达的解。水会往压力更小的那个方向流,技术也如此。即不同于PC时代开启的芯片摩尔定律,由于工艺制程更难产,这一轮对算力单元的规模化落脚点就是机柜,在这次GTC上,NVL72是变化开始也是未来方向;该尺度上将在系统级延续摩尔定律。机柜这个粒度就是将计算单元的空间缩放控制在IB/以太网之前(对于英伟达就是nvlink能到哪里),最大化带宽性价比,背后的规律就是计算单元离得越近数据传输速度越快,且通信成本也越小。

芯片以上,机柜以下,将成为数据中心算力规模化的核心战场。为了在狭小的空间塞进更多的计算,除了芯片上要卷先进封装,卷chiplet,卷更多hbm(hbm很贵但单位带宽价格趋近于0),NVL72中的18个服务器机箱36张板72块B200已完全延申到背板nvlink通信,并采用了更廉价的铜连接,单位空间功率内卷也使得液冷等散热模式不可或缺。

结论部分。可据以上分析来寻找投资机会。

1、比如解决方案提供商视角上的启发,英伟达大概率会领导这条系统级摩尔定律路线,建立行标形成标准/技术护城河,护城河的壁垒程度决定了替代方案的空间(英伟达方案里存在大量私有技术,AMD的开放产业联盟/网络合作商,以及国内自主可控的潜在独立生态,去跟英伟达这条路线可能性很大,能不能跟上就看替代方案的效率)。英伟达更像x86规模化时期的英特尔,而不像互联网泡沫前后的思科(因为思科的产品即网络设备在技术纵深向上的规模化空间不够大,所以能被竞争者如hw轻松吃掉市场份额)。需要注意的是,英伟达系统级规模化虽刚刚上路,但已如此市值,后续还有多少空间?类比英特尔始于上世纪90年代终至2015年左右的tick-tock,即便在规模化后期即tick-tock时期(10nm制程受阻以前,约2007-2017年间),英特尔规模化联盟(英特尔/微软等标的)仍能跑赢市场(纳指),但同期x86软硬件基础设施之上的应用级或替代线的谷歌苹果均远远跑赢市场。类比结果就是,现在gen-AI不存在如同x86时期互联网/移动互联网等下游明确的应用级标的,英伟达很可能尚处于前段规模化时期,此阶段是规模化议价强势方,而在市场培育到一定阶段时,可再寻找更佳标的以获得超越市场的投资收益。

2、供应商/合作方视角,如果英伟达系统级摩尔定律能够持续数代,这里有许多价值流向的机会(注意,在当前阶段下述都是量的机会,毛利也在被英伟达吸血)。从芯片到机柜逐级来看: (1)hbm不嫌多,单位带宽零成本可谓堆得越多越合适; (2)先进封装将大有可为,这是晶圆厂的蓝海; (3)光通信失宠,铜缆重装上阵,计算都挨得这么近了,以后会更密更近,铜连接忽然顺眼了,便宜又好用,这是反直觉的增量; (4)散热技术如液冷时代到来,机柜单位功率只会继续增加,系统级的散热工程无比重要; (5)还有一个潜在的问题领域,即IB/以太网这块恐怕并不是好选择,亦即此级的网络设备,还有资本重点关注的光通信/光芯片/光模块很可能并不是此轮规模化的外延部。

3、其他视角,主要是数据中心的买方,比如CSP等,由于它们还往往附着推动gen-AI应用突破的交叉业务,与本文逻辑关系不够直接,不赘述。

风险/免责:当前通向AGI路线证伪则以上逻辑恐将失效,规模化进程中如有关键技术突破另当别论。

精彩讨论

翻番06-06 23:29

感谢回复!老兄这个回复涉及投资一个新兴产业的底层逻辑,因为此类投资模式具有可重复性,即使不是这轮gen-AI,未来我们也可能会遇到其他浪潮,因此有必要探讨,目的是不要错过行情(我觉得gen-AI投资现在开始都不晚)。
首先,我觉得你的观点有一个很重要的隐含假设,就是认为金融资本(gen-AI一案就是华尔街)或形成了一个人格化的主体,是这轮gen-AI浪潮的推手,它甚至有意识来制造泡沫、收割财富,甚至这个金融资本能控制产业资本的投向。这一点我不甚同意,不客气的说,这有点阴谋论的倾向。相反,我认为每个产业变迁的参与者都是能够独立判断的个体,是会对自己的真金白银负责的,产业资本不会无缘无故豪赌,金融资本作为活水可能影响产业资本,但没法真正绑架产业资本,以产业资本长期特性和对实际产出的重视特征,让其具有不同于金融资本短期特征的严肃性,更是决定金融资本的父层逻辑。这次产业资本形成了合力,给金融资本唱戏搭了一个大台子,金融资本在这出戏中存在感虽强但其实并非主角。为什么区分金融资本和产业资本的不同如此重要呢,因为在长期投资的过程中,我们要判别增长、周期和泡沫,要区分概念性还是产业化,要识别投资所处的产业阶段。回到现实,可以翻翻chatgpt是什么时候发布的,英伟达是什么时候开始加速起飞的,这么大的产业体量,金融资本真是不见兔子不撒鹰的,他们这些贪婪鬼是在英伟达业绩可见性清晰时才入局的。同理,金融资本围猎AMD的翻倍行情什么时候开始的?也是苏妈喊出收入20亿刀时对不对呢?
而瞄着产业资本进行投资时,一个重点就是判断这个产业所处的阶段,在产业培育初期,形成不了盈利循环非常普遍,我们不能因为成本高昂、终端渗透率低或收入少就断定未来不会形成良性循环。上世纪90年代中后期,网吧上网一个小时几十块钱,最终能够下降到两三块钱,初期上网是少数人的奢侈品,成熟期上网则是家庭必需品,其他产业也都经历过规模化提高渗透率降本增效的过程。当然,也并非所有产业都能如初期展望那样最终达到预期的TAM,很多时候是雷声大雨点小,一旦金融资本发现端倪,便会出现泡沫破灭的情况。那这次gen-AI是什么情况呢?有泡沫吗?我的答案是不知道。我也不知道LLM是否能一定通向AGI,我也不知道现在有泡沫还是未来会有泡沫。我的投资策略是,战略上乐观一点,因为过往历史表明,规模化一旦启动许多看似不可能的事都会逐渐解决,但我也会谨慎跟踪,走一步看一步。至少,在当前这个阶段,scaling law是有效的,产业是向前滚动的,规模化是快速进行的。下一阶段呢,我需要有足够的产业能够持续做大做强的理由,或逻辑被证伪的理由,来持续指导投资决策(比如说如ev产业那样投资逻辑证伪的,没能持续规模化反而陷入内卷的情况就跑;如果是移动互联网/云计算这种逻辑顺畅却陷入周期性的,就做投资标的迁移尽量把握更大的机会)。
以史为鉴,这几年我所经历的就有移动互联网(云计算)/大数据/vr/3d打印/加密货币/ev等产业大小潮水,我没真正全程参与过的有集成电路/pc/互联网这样重量级浪潮。如果深入到每一次大小潮水中,就会了解到,并非每一个早期概念都会像这次gen-AI浪潮一样有这么多产业资本和金融资本共同参与。退一步讲,我们观察金融资本流向的目的,其实反而是更进一步探查产业资本到底怎么想,在vr/加密货币甚至ev这种稍大的产业级潮水中,诸多大的产业资本就很克制,为什么到了gen-AI,就看到了如同那些大的重量级浪潮下的产业资本参与的广度和深度,甚至有过之而无不及,很快我们就能看到苹果也最终下场了。至少在这个阶段我相信产业资本们的智慧,以后的事儿再骑驴看唱本。

翻番06-03 11:24

mackler对技术变迁有比较深刻的洞察,其关于硬件生态位演进的看法很惊艳,我也受益良多。但是这次主要对英伟达的大盒子战略提出“破绽”,我多聊几句,把这个事儿尽量说明白。
首先需要说的是,我们不仅是技术观察者,也是投资人,说白了就是要找到这场行业巨变中钱在产业里流向哪里,为什么要那样流动,产业的钱往哪里流,金融的钱就会往哪里流,哪里估值就会变好,这是我们投资赚钱的最简单理论。而当下要研究的gen-AI产业,不仅涉及复杂的技术和工程,不仅需要老黄这样的产业领袖实践解决方案,它本质上也是极其庞大且快速发展的产业,产业化恪守经济规律,花的是所有参与者的真金白银。一旦抛开技术视角,让位于经济学角度思考问题,其实gen-AI产业链和所有历史上IT细分产业的变迁规律都有莫大相似之处。
从经济概念去理解这一深刻的产业重塑过程,就不能把老黄的以数据中心为计算单元的规模化过程简单理解为一次行业内卷,内卷指的是无效的、低效的竞争,而产业化、规模化是经济的,有效的客观路径,不以人的意志为转移。作为产业化浪潮中一个举足轻重的参与者,许多人容易误解的一点是认为,英伟达的高毛利率是老黄领衔的资本的贪婪本性使然,在客户和竞争者的压力下是无法长期维持的。但其中忽视的却是,价值集中过程并非是一家企业能完全自身决定的,而是产业链上下游通力合作长期议价的博弈结果;特别是这其中力图改变高毛利现状的最主要推手正是老黄本人。为什么这么说呢,因为产业化、规模化的过程本质上就是要打破市场目前的不均衡态,降本增效,最终达到一个更为合理的出清状态,哪怕那种状态最终降低了毛利率,但获得更大TAM下的更高利润(半导体的祖师爷仙童就是因拒绝主业规模化而失败的先驱)。
因此,目前的英伟达发展路径从技术上看似同构大盒子方案一路走到黑,本质上恰恰是在押注scaling law长期有效的条件下一次产业豪赌,你当然也会看到英伟达搞40系列瞄着所谓性价比推理,马上也会有AI PC这种我当前不看好方向的更多信息披露,但这都不是这家公司的投资重点,重点就是围绕那个最高算力方向的飞速规模化过程,算力、存储、带宽通通力大飞砖,有些人觉得浪费,殊不知这是最节约最经济的路径。如果有一天英伟达也像前两年英特尔各种无章法收购搞横向一体化了,那也就说明它规模化到头了,高增长高收益的过程快结束了。当然,目前离这一时点还早着呢(这里可以再回到技术层面看,数据中心的优化空间还非常大,技术纵深大有可为)。从这一点出发,如果质疑英伟达的大盒子灵活性过多,兼顾过多,不够优化场景,质疑其太过私有不开放,太贵了,都是不合适的。因为规模化的本质就是产业化带来的降本增效,最终疗效就是一力降十会。iphone拆开配件卖比整机还贵;iphone的ios/硬件也够私有了吧;买iphone的人中,我是游戏玩家,会榨干算力,但鲜少用到摄像头;你是citywalk小姐姐,三摄前摄用了个遍,从来不咋用gpu,但iphone只有一款盒子,不会给不同场景搞独特需求的解决方案,没有游戏机和拍照机的区分,和英伟达目前搞通用大盒子的底层原理是一样的,因为足够强大就足够便宜了。只有行业追随者才会搞垂直需求,才会单点爆破,才会有定制芯,才会搞性价比,这是对“力”不足做出的“会”补偿。类比iphone,它的竞争对手不都这么弄吗?但这些行业追随者的利润水平是啥样子的呢?所以英伟达搞大盒子才不是破绽,而是最基本的行业规律。(当然,我知道一拿iphone产业做类比,就又会有人跳出来说你一个2b,一个2c,不一样不一样;我之前提过一个关于2c/2b市占终局的问题,我没给予解答。在我的分析框架里,我是不区分2b还是2c的,这两者其实可以建立统一模型,没啥区别,本质上还是给客户满足需求的基础上做到成本最低,又回到规模化的叙事,以后有机会再展开说)。
那么,如果深刻理解了老黄战略背后是受产业化、规模化的规律支配这一原理,至于他用不用x86都不重要了,如果x86有利于规模化就用,不利于就让位私有技术,除非x86好用偏不用才是自废武功。这也就同时解释了nvlink/if这类技术为啥如此健壮,难不成AMD也是故意不用x86的通信协议吗?逻辑是不是就不自洽了?无外乎x86在适应gen-AI快速增量需求上给的标准太慢了。同理,以太网旧有协议真那么好用,就不必搞超以太了对吧。这也都不是破绽,这是取舍,为了最大规模的需求,做出剃掉兼容需求的让步。
最后再聊聊gen-AI的边际成本问题,这是一个不容忽视的问题。mackler的意思是与互联网那种多一个边际用户成本微乎其微来比较,gen-AI的用户每多一个的开销要更大,互联网效应变小了。首先,两个不同行业直接比较成本就不合适,因为gen-AI带给用户的效用是传统互联网能比的吗?成本之间不能直接比较,而是要和各自最终的效用,最终的收入来比。AGI一旦逼近,直取式互联网望尘莫及,这其中的差距可比功能手机和智能手机的差距还要大得多,你能说iphone边际成本要更高就没市场吗?第二就是当下还是gen-AI的早期形态,产业需要培育,不是规模化最终面貌,抛开发展来掐住早期形态批评不可取,否则这些CSP岂不都是傻子?一旦老黄的规模化再来个几年,等能在PC机箱放入超算算力也能有可以承受的价格(类比仙童/英特尔把ENIAC弄进集成芯,类比iphone产业链打通后边际成本下降的过程),准AGI机器人的条件是不是就成熟许多了?等大家看明白了,投资机会就比现在少了。所以这个阶段的重中之重,就是向前看,向远看,看清规模化大势的未来,而当下的种种不足不过是浩浩汤汤大潮下折射的小阴影罢了。短期现实就是随后看看NVL36/72/576的销售情况我们再来讨论。 $英伟达(NVDA)$

forcode06-07 07:20

英伟达或许还有几倍的长期增长空间(10~20年后回头看),但目前股价在短时间里涨了这么多倍,包含了非常乐观的预期在里面,一旦下游企业的应用和盈利进度不如预期,短期内腰斩两次也未尝不可,直线上涨不是新事物发展的普遍模式,曲折前进才是常态,上涨潜力被大部分透支,中短期下跌潜力却可能很大,英伟达的风险收益比,没那么让人安枕无忧,安全边际不足。
2000年很多人对宽带的投资和广泛应用预期,站在今天来看,多数成为现实,但90%以上的投资和公司,可能都成了炮灰,当炮灰大规模破产时,明星股也可以腰斩。

翻番05-31 12:35

鞭打快牛,快牛更快,我先抛出我的观点。
结合原文提到的此轮数据中心规模化边界是机柜(还有各种叫法:机架/Rack/Pod),边界以内的规模化是纵向扩展(scale up),边界以外是横向扩展(scale out),而这次UALink联盟瞄准的是scale up,对标英伟达的NVlink;需要补充说明的是,超以太联盟则负责解决scale out,针对英伟达的IB/SpectrumX。
UALink联盟C位显然是AMD,祭出IF作为协议基础,料网络公司(博通、思科)将基于这个开放协议开发交换设备,甚至连x86死对头英特尔都要了一把椅子,因为大敌当前,务必一致对外。至此,AI浪潮下数据中心的竞争格局也更清晰化,英伟达的一体化解决方案,以及AMD这边的开放产业联盟。恐怕大家最关心竞争结果,AMD能拿到多少份额呢?
鉴往知来,我反复提到的上世纪90年代以降的x86产业规模化可资借镜,正是有AMD这道鞭子,才让最后的赢家只剩两家。除了这条主线外,x86架构上的“附属设备”GPU,即便只作为3d图形这个功能,也逃过了成为英特尔“指令集”的宿命,皆因那些时日英伟达规模化总快过英特尔一步,功耗和重要性大到只能独立出一个生态位,拉崩集显,终而未被替代,而据老黄说“上世纪90年代竞争者最多时达到了200家”,如果没有杀出重围,就没有今天反向驱逐x86的野望。那么,这些最终的赢家有没有共同点,成功的秘辛是什么?是快,天下scale,唯快不破。
因此,在scaling law仍会持续有效的gen-AI路径里,比的也是谁的规模化更快。跟随者是一个产业联盟,粗看高手云集,其实这里面最大公约数到底有多大,好几对儿竞争者的联盟能否发挥足够合力?为什么还有一些利益攸关者(Amzn呢?Arista呢?Dell呢?)没进来?领导者能否抚平各方的利益关系?我想,AMD肯定会赚钱,但最终蛋糕能有多大是存在挑战的,祝苏妈好运。
利益相关,我仍持有部分AMD仓位,我也在期待进一步的结果。但是,我仍相信英伟达的胜率更大,亦即会持续拿到价值链中最大那一块,并在rack尺度上加速规模化,最终目标就是解决如何让搬运数据的成本最小化,如何在存算不断缩微之下更高效排出热量,同时如何最优化TCO。这里面工程化的空间很大,先进封装的巨大机会,新型材料的机会(这么大规模的产业需求甚至让金刚石基板都箭在弦上),液冷的机会,硅光的机会,从而让摩尔定律在这个尺度上继续得以延申和突破。说点题外话,这些技术有朝一日也会扩散到边缘,想没想过很可能不远的未来一个PC机箱能装下过往超算的算力,VR也会因新材料和散热技术扩散而小型化到一个眼镜大小。而这,和当下的弱鸡边缘AI完全不是一个东西。我相信相当时间里的主线仍不会离开数据中心,这是此轮规模化的第一战场,也是价值最集中的产业区段。

翻番04-27 15:19

客气了。巨头们的季报还没完全披露完,但目前都提高了资本支出,这个没啥新观点就不赘言了。在此刻反复再强调的几点,大多也都是老生常谈了。
如果在这个节点再拿英伟达和思科比不是蠢就是坏,英伟达更像90年代进入规模化的x86阵营(英特尔&微软),从B系列开始,英伟达进入以数据中心为计算单元的规模化进程,大概率形成越来越宽的护城河。可以翻看那几年对标企业的财报,英特尔毛利率在50-60%,微软毛利率在80%+,而当下的英伟达是一个系统化集合体,制霸产业链关键环节,生态位优于当年英特尔/微软单一企业,议价能力当下虽处于当年硬件企业英特尔和软件企业微软的中间状态,这还是因为下游相比当年x86面对的环境更强势一些。除了相似点,也有不同点,英伟达相比x86阵营规模化早期,面对的主要是2B用户,这些巨头们财务状况良好,资本支出越来越多,好的一方面是规模化会有充足的收入/研发资金保障(不会过早寅吃卯粮),挑战是一旦规模化不如预期巨头们也会自己下场(需要与谷歌这种跑通全栈的自研体系继续比拳头)。
在应用方面,虽然目前从巨头财报中看到AI已经在优化盈利结构,但当前的盈利才哪到哪,AI的终极应用定然不会是类copilot这么初步而单一的形态。x86奠定的PC浪潮最终通向了互联网革命,市场培育了十多年漫长的时光,才缔造了亚马逊/谷歌/meta等应用巨头,取得盈利的节奏又各自不同,比如亚马逊是比较晚近才赚钱。当前我们在经历AI市场培育的早期,巨头们的乐观情绪在支出上得以初步体现,市场渗透率或技术成熟度必须要达到一定标准后,才有条件去聊应用形态和盈利,如果经常性怀疑下游不盈利而质疑产业,那对这些产业玩家的魄力也太没有信心了点。
再说一下竞争格局,英伟达这条线比较容易看懂,我的观点从去年年中起未变,它是现阶段赌AI最好的标的,产业化最易成功,是可以all in级的标的。AMD作为复制英伟达体系的标的,尚存在难以估量的不确定性,但就像苏妈所说,快速发展的蓝海不存在护城河;极难的境遇也因人而不同,赌AMD需要极强韧性——对信息的挖掘能力、个人风险承受能力和为投资失败做的准备,从产业角度我目前看不大清,需要跟踪再看,先看这次财报苏妈怎么说,谋定而后动。另一条线就是以谷歌TPU为代表的巨企自研,以产业角度看其自身市场小于通用化整体市场TAM,至少在这个阶段英伟达线具备更佳的产业确定性。即便像谷歌这种自己业务梭哈自研的巨企,谷歌云仍是两条腿走路,也在为英伟达贡献研发经费,毕竟在面对一个快速增长的市场时,谷歌身体是诚实的。
最后,一旦明确英伟达规模化投资思路,也可以顺着去找有一定价值汲取能力的供应商&合作方定向优化投资结构(鉴于英伟达全产业链一时无两的议价能力,这里的机会仍是以量为主的预期差),并在战略上关注下游应用动向(现阶段太过风投化,还是战略性关注即可或搞ETF),将极大可能就是未来的AI投资的主线。

全部讨论

04-27 16:34

04-26 11:36

最近發生了許多事情,翻番友判斷的很准,請岀來点評一下,謝謝你

04-15 16:36

假设AI需求是持续的,那么目前衍生出来确定性最高的就是hbm的需求。

04-15 16:30

04-13 21:31

先赞后看