gen-AI时代向规模化演进的投资机会

发布于: 雪球转发:22回复:226喜欢:130

注:作为近期小节,本文主旨大抵来源于雪球网友们讨论,并启发收束于一篇雄文(评论附链接)。

现实背景:chatgpt引爆gen-AI,LLM成为通向AGI的可能。越早摘得AGI果实的玩家获得越大奖励,军备竞赛开始。根据scaling law,玩家们无止境渴求加速计算算力。易得:

1、更大的角度上,持续而规模巨大的加速计算算力需求,让训练LLM的主战场只能集中于数据中心/云端,换言之,这是一场关乎【数据中心】的军备竞赛。

2、稍具体的角度上,加速计算需求猛增,而芯片摩尔定律失速,二者之间矛盾凸显。单芯片加速算力不足,又鉴于LLM对存算带宽的迫切要求,GPU厂已在通过chiplet/增大带宽等各种办法来应对需求,下一步如何系统级规划集群架构成为关键。

有鉴于此,先看英伟达的解。水会往压力更小的那个方向流,技术也如此。即不同于PC时代开启的芯片摩尔定律,由于工艺制程更难产,这一轮对算力单元的规模化落脚点就是机柜,在这次GTC上,NVL72是变化开始也是未来方向;该尺度上将在系统级延续摩尔定律。机柜这个粒度就是将计算单元的空间缩放控制在IB/以太网之前(对于英伟达就是nvlink能到哪里),最大化带宽性价比,背后的规律就是计算单元离得越近数据传输速度越快,且通信成本也越小。

芯片以上,机柜以下,将成为数据中心算力规模化的核心战场。为了在狭小的空间塞进更多的计算,除了芯片上要卷先进封装,卷chiplet,卷更多hbm(hbm很贵但单位带宽价格趋近于0),NVL72中的18个服务器机箱36张板72块B200已完全延申到背板nvlink通信,并采用了更廉价的铜连接,单位空间功率内卷也使得液冷等散热模式不可或缺。

结论部分。可据以上分析来寻找投资机会。

1、比如解决方案提供商视角上的启发,英伟达大概率会领导这条系统级摩尔定律路线,建立行标形成标准/技术护城河,护城河的壁垒程度决定了替代方案的空间(英伟达方案里存在大量私有技术,AMD的开放产业联盟/网络合作商,以及国内自主可控的潜在独立生态,去跟英伟达这条路线可能性很大,能不能跟上就看替代方案的效率)。英伟达更像x86规模化时期的英特尔,而不像互联网泡沫前后的思科(因为思科的产品即网络设备在技术纵深向上的规模化空间不够大,所以能被竞争者如hw轻松吃掉市场份额)。需要注意的是,英伟达系统级规模化虽刚刚上路,但已如此市值,后续还有多少空间?类比英特尔始于上世纪90年代终至2015年左右的tick-tock,即便在规模化后期即tick-tock时期(10nm制程受阻以前,约2007-2017年间),英特尔规模化联盟(英特尔/微软等标的)仍能跑赢市场(纳指),但同期x86软硬件基础设施之上的应用级或替代线的谷歌苹果均远远跑赢市场。类比结果就是,现在gen-AI不存在如同x86时期互联网/移动互联网等下游明确的应用级标的,英伟达很可能尚处于前段规模化时期,此阶段是规模化议价强势方,而在市场培育到一定阶段时,可再寻找更佳标的以获得超越市场的投资收益。

2、供应商/合作方视角,如果英伟达系统级摩尔定律能够持续数代,这里有许多价值流向的机会(注意,在当前阶段下述都是量的机会,毛利也在被英伟达吸血)。从芯片到机柜逐级来看: (1)hbm不嫌多,单位带宽零成本可谓堆得越多越合适; (2)先进封装将大有可为,这是晶圆厂的蓝海; (3)光通信失宠,铜缆重装上阵,计算都挨得这么近了,以后会更密更近,铜连接忽然顺眼了,便宜又好用,这是反直觉的增量; (4)散热技术如液冷时代到来,机柜单位功率只会继续增加,系统级的散热工程无比重要; (5)还有一个潜在的问题领域,即IB/以太网这块恐怕并不是好选择,亦即此级的网络设备,还有资本重点关注的光通信/光芯片/光模块很可能并不是此轮规模化的外延部。

3、其他视角,主要是数据中心的买方,比如CSP等,由于它们还往往附着推动gen-AI应用突破的交叉业务,与本文逻辑关系不够直接,不赘述。

风险/免责:当前通向AGI路线证伪则以上逻辑恐将失效,规模化进程中如有关键技术突破另当别论。

精彩讨论

翻番06-06 23:29

感谢回复!老兄这个回复涉及投资一个新兴产业的底层逻辑,因为此类投资模式具有可重复性,即使不是这轮gen-AI,未来我们也可能会遇到其他浪潮,因此有必要探讨,目的是不要错过行情(我觉得gen-AI投资现在开始都不晚)。
首先,我觉得你的观点有一个很重要的隐含假设,就是认为金融资本(gen-AI一案就是华尔街)或形成了一个人格化的主体,是这轮gen-AI浪潮的推手,它甚至有意识来制造泡沫、收割财富,甚至这个金融资本能控制产业资本的投向。这一点我不甚同意,不客气的说,这有点阴谋论的倾向。相反,我认为每个产业变迁的参与者都是能够独立判断的个体,是会对自己的真金白银负责的,产业资本不会无缘无故豪赌,金融资本作为活水可能影响产业资本,但没法真正绑架产业资本,以产业资本长期特性和对实际产出的重视特征,让其具有不同于金融资本短期特征的严肃性,更是决定金融资本的父层逻辑。这次产业资本形成了合力,给金融资本唱戏搭了一个大台子,金融资本在这出戏中存在感虽强但其实并非主角。为什么区分金融资本和产业资本的不同如此重要呢,因为在长期投资的过程中,我们要判别增长、周期和泡沫,要区分概念性还是产业化,要识别投资所处的产业阶段。回到现实,可以翻翻chatgpt是什么时候发布的,英伟达是什么时候开始加速起飞的,这么大的产业体量,金融资本真是不见兔子不撒鹰的,他们这些贪婪鬼是在英伟达业绩可见性清晰时才入局的。同理,金融资本围猎AMD的翻倍行情什么时候开始的?也是苏妈喊出收入20亿刀时对不对呢?
而瞄着产业资本进行投资时,一个重点就是判断这个产业所处的阶段,在产业培育初期,形成不了盈利循环非常普遍,我们不能因为成本高昂、终端渗透率低或收入少就断定未来不会形成良性循环。上世纪90年代中后期,网吧上网一个小时几十块钱,最终能够下降到两三块钱,初期上网是少数人的奢侈品,成熟期上网则是家庭必需品,其他产业也都经历过规模化提高渗透率降本增效的过程。当然,也并非所有产业都能如初期展望那样最终达到预期的TAM,很多时候是雷声大雨点小,一旦金融资本发现端倪,便会出现泡沫破灭的情况。那这次gen-AI是什么情况呢?有泡沫吗?我的答案是不知道。我也不知道LLM是否能一定通向AGI,我也不知道现在有泡沫还是未来会有泡沫。我的投资策略是,战略上乐观一点,因为过往历史表明,规模化一旦启动许多看似不可能的事都会逐渐解决,但我也会谨慎跟踪,走一步看一步。至少,在当前这个阶段,scaling law是有效的,产业是向前滚动的,规模化是快速进行的。下一阶段呢,我需要有足够的产业能够持续做大做强的理由,或逻辑被证伪的理由,来持续指导投资决策(比如说如ev产业那样投资逻辑证伪的,没能持续规模化反而陷入内卷的情况就跑;如果是移动互联网/云计算这种逻辑顺畅却陷入周期性的,就做投资标的迁移尽量把握更大的机会)。
以史为鉴,这几年我所经历的就有移动互联网(云计算)/大数据/vr/3d打印/加密货币/ev等产业大小潮水,我没真正全程参与过的有集成电路/pc/互联网这样重量级浪潮。如果深入到每一次大小潮水中,就会了解到,并非每一个早期概念都会像这次gen-AI浪潮一样有这么多产业资本和金融资本共同参与。退一步讲,我们观察金融资本流向的目的,其实反而是更进一步探查产业资本到底怎么想,在vr/加密货币甚至ev这种稍大的产业级潮水中,诸多大的产业资本就很克制,为什么到了gen-AI,就看到了如同那些大的重量级浪潮下的产业资本参与的广度和深度,甚至有过之而无不及,很快我们就能看到苹果也最终下场了。至少在这个阶段我相信产业资本们的智慧,以后的事儿再骑驴看唱本。

StevenLH06-19 02:05

上周收到的儿子给我的今年父亲节礼物好特别。甚至给我带来了灵感。
平时总是和儿子提Jensen Huang,因为我实在找不到比他更好的role model了。难得13岁的少年已有这番心意。

翻番06-12 15:33

首先,我的观点没变,不要被现下的形势迷了眼。
金融资本用钱投票的背后可能是意识到,苹果所定义的形态有望成为未来一个阶段边缘ai的范式,即操作系统级本地小模型+对大模型的远程调用。但是,我一贯的观点都是,端侧这个小匣子毕竟太小了,看看苹果对设备的支持,iphone这边仅仅支持15pro,局促之地的确放不下多少算力,放下了散热就是大问题,未来技术&工程革新的主战场必然是数据中心(附送油管代码1WYJaFDTo4o,虽是andy大佬去年的前瞻,但这些技术可能率先实现在端侧吗?)。有一些分析师把苹果的做法理解为推动换机,这未免浅薄了。哪有一个新功能连发布不到一年的新产品都不支持的?这既表明本地废物算力无法承载足够的AIGC需求,也意味着这次苹果的下场既被动又紧迫。
深入分析一下苹果的ai架构,大致分为三层:本地的,内部自建的远程大模型(Private Cloud Compute)作为补充,以及开放给第三方的如chatgpt的远程大模型接口负责更复杂的生成任务。这里有趣就有趣在那个中间缓冲层,亦即内部自建的私有云数据中心,苹果给的理由是皆因安全,独立分析师都可以来查验代码,我们保护用户隐私,不持久化数据云云。殊不知这只是一个战略烟幕弹。要知道,搜索引擎时代,谷歌每年给苹果200亿刀,难道谷歌就丝毫获得不了用户的隐私、个性化搜索内容吗?为什么苹果不自建一个搜后即删关键词的无广告搜索引擎呢?无他,与己无危耳。所以,我判断,苹果是有意把隐私混淆为使用AIGC的必要条件,以把chatgpt这种功能更为强大的工具优先级排低,只把不侵入操作系统操控权的生成内容任务外包。或者我换一种说法,即便当前版本的chatgpt(4o)也已经强大到只要看一眼你的屏幕,再给予其一些基本的操作系统级api,它就可以取代操作系统,这也太具威胁了吧,绝不能交权。或者我再换一种说法,当下所有gen-AI演进的一个间接目标,都是为了有朝一日取代操作系统,作为语言层插入人类与操作系统之间,让操作系统退居幕后成为一个中性层,而语言大模型最终将成为那个直接与人类交互的桥梁。而苹果,恐惧的就是这点。务必以空间换时间,不能出让给这些强大的大模型操作系统的操控权,必须保护用户入口的掌控权,以期有朝一日自己不能被落得太远,甚至反超。这就是Private Cloud Compute这个缓冲层得以存在的真正意义。在这个生态位上,Private Cloud Compute与chatgpt未来的竞争就是谁能更快迭代,谁把谁落下,谁最先摘到AGI的果子,从而谁才是人类真正的贴身助理。
总结一下,操作系统厂商们是存在隐忧的,过往操作系统对使用者存在巨大的粘性,是因为我们直接操作的是操作系统,太亲肤啦。但在这条gen-AI发展之路上,总会有操作系统不在意用户直不直接使用,愿意让渡给智能助手更多的权限,甚至底层的操控权。一旦这一日到来,操作系统凛冬将至。
因此,这是苹果不能输的战争。苹果下场后,大家以为边缘ai的参赛者都入局了,但实际上正是数据中心gen-AI竞争大幕完全展开之始。就像我之前说的,gen-AI作为分水岭,之前的互联网/移动互联网/云计算时代是端到云的算力变迁,而这一次是云到端的算力下放和技术扩散,边缘ai相当一段时间都是个配角,生态位上无法和云端ai比算力、比聪明、比谁能执行更复杂的任务、比谁先到agi,被支配就将缺乏话语权。只要scaling law持续有效,这种操作系统形态不会持续太久的。
至于谁赢谁输,目前还不好说,openai当前阶段胜率大一点,但跟随者都非善茬,再看看。

翻番06-03 11:24

mackler对技术变迁有比较深刻的洞察,其关于硬件生态位演进的看法很惊艳,我也受益良多。但是这次主要对英伟达的大盒子战略提出“破绽”,我多聊几句,把这个事儿尽量说明白。
首先需要说的是,我们不仅是技术观察者,也是投资人,说白了就是要找到这场行业巨变中钱在产业里流向哪里,为什么要那样流动,产业的钱往哪里流,金融的钱就会往哪里流,哪里估值就会变好,这是我们投资赚钱的最简单理论。而当下要研究的gen-AI产业,不仅涉及复杂的技术和工程,不仅需要老黄这样的产业领袖实践解决方案,它本质上也是极其庞大且快速发展的产业,产业化恪守经济规律,花的是所有参与者的真金白银。一旦抛开技术视角,让位于经济学角度思考问题,其实gen-AI产业链和所有历史上IT细分产业的变迁规律都有莫大相似之处。
从经济概念去理解这一深刻的产业重塑过程,就不能把老黄的以数据中心为计算单元的规模化过程简单理解为一次行业内卷,内卷指的是无效的、低效的竞争,而产业化、规模化是经济的,有效的客观路径,不以人的意志为转移。作为产业化浪潮中一个举足轻重的参与者,许多人容易误解的一点是认为,英伟达的高毛利率是老黄领衔的资本的贪婪本性使然,在客户和竞争者的压力下是无法长期维持的。但其中忽视的却是,价值集中过程并非是一家企业能完全自身决定的,而是产业链上下游通力合作长期议价的博弈结果;特别是这其中力图改变高毛利现状的最主要推手正是老黄本人。为什么这么说呢,因为产业化、规模化的过程本质上就是要打破市场目前的不均衡态,降本增效,最终达到一个更为合理的出清状态,哪怕那种状态最终降低了毛利率,但获得更大TAM下的更高利润(半导体的祖师爷仙童就是因拒绝主业规模化而失败的先驱)。
因此,目前的英伟达发展路径从技术上看似同构大盒子方案一路走到黑,本质上恰恰是在押注scaling law长期有效的条件下一次产业豪赌,你当然也会看到英伟达搞40系列瞄着所谓性价比推理,马上也会有AI PC这种我当前不看好方向的更多信息披露,但这都不是这家公司的投资重点,重点就是围绕那个最高算力方向的飞速规模化过程,算力、存储、带宽通通力大飞砖,有些人觉得浪费,殊不知这是最节约最经济的路径。如果有一天英伟达也像前两年英特尔各种无章法收购搞横向一体化了,那也就说明它规模化到头了,高增长高收益的过程快结束了。当然,目前离这一时点还早着呢(这里可以再回到技术层面看,数据中心的优化空间还非常大,技术纵深大有可为)。从这一点出发,如果质疑英伟达的大盒子灵活性过多,兼顾过多,不够优化场景,质疑其太过私有不开放,太贵了,都是不合适的。因为规模化的本质就是产业化带来的降本增效,最终疗效就是一力降十会。iphone拆开配件卖比整机还贵;iphone的ios/硬件也够私有了吧;买iphone的人中,我是游戏玩家,会榨干算力,但鲜少用到摄像头;你是citywalk小姐姐,三摄前摄用了个遍,从来不咋用gpu,但iphone只有一款盒子,不会给不同场景搞独特需求的解决方案,没有游戏机和拍照机的区分,和英伟达目前搞通用大盒子的底层原理是一样的,因为足够强大就足够便宜了。只有行业追随者才会搞垂直需求,才会单点爆破,才会有定制芯,才会搞性价比,这是对“力”不足做出的“会”补偿。类比iphone,它的竞争对手不都这么弄吗?但这些行业追随者的利润水平是啥样子的呢?所以英伟达搞大盒子才不是破绽,而是最基本的行业规律。(当然,我知道一拿iphone产业做类比,就又会有人跳出来说你一个2b,一个2c,不一样不一样;我之前提过一个关于2c/2b市占终局的问题,我没给予解答。在我的分析框架里,我是不区分2b还是2c的,这两者其实可以建立统一模型,没啥区别,本质上还是给客户满足需求的基础上做到成本最低,又回到规模化的叙事,以后有机会再展开说)。
那么,如果深刻理解了老黄战略背后是受产业化、规模化的规律支配这一原理,至于他用不用x86都不重要了,如果x86有利于规模化就用,不利于就让位私有技术,除非x86好用偏不用才是自废武功。这也就同时解释了nvlink/if这类技术为啥如此健壮,难不成AMD也是故意不用x86的通信协议吗?逻辑是不是就不自洽了?无外乎x86在适应gen-AI快速增量需求上给的标准太慢了。同理,以太网旧有协议真那么好用,就不必搞超以太了对吧。这也都不是破绽,这是取舍,为了最大规模的需求,做出剃掉兼容需求的让步。
最后再聊聊gen-AI的边际成本问题,这是一个不容忽视的问题。mackler的意思是与互联网那种多一个边际用户成本微乎其微来比较,gen-AI的用户每多一个的开销要更大,互联网效应变小了。首先,两个不同行业直接比较成本就不合适,因为gen-AI带给用户的效用是传统互联网能比的吗?成本之间不能直接比较,而是要和各自最终的效用,最终的收入来比。AGI一旦逼近,直取式互联网望尘莫及,这其中的差距可比功能手机和智能手机的差距还要大得多,你能说iphone边际成本要更高就没市场吗?第二就是当下还是gen-AI的早期形态,产业需要培育,不是规模化最终面貌,抛开发展来掐住早期形态批评不可取,否则这些CSP岂不都是傻子?一旦老黄的规模化再来个几年,等能在PC机箱放入超算算力也能有可以承受的价格(类比仙童/英特尔把ENIAC弄进集成芯,类比iphone产业链打通后边际成本下降的过程),准AGI机器人的条件是不是就成熟许多了?等大家看明白了,投资机会就比现在少了。所以这个阶段的重中之重,就是向前看,向远看,看清规模化大势的未来,而当下的种种不足不过是浩浩汤汤大潮下折射的小阴影罢了。短期现实就是随后看看NVL36/72/576的销售情况我们再来讨论。 $英伟达(NVDA)$

forcode06-07 07:20

英伟达或许还有几倍的长期增长空间(10~20年后回头看),但目前股价在短时间里涨了这么多倍,包含了非常乐观的预期在里面,一旦下游企业的应用和盈利进度不如预期,短期内腰斩两次也未尝不可,直线上涨不是新事物发展的普遍模式,曲折前进才是常态,上涨潜力被大部分透支,中短期下跌潜力却可能很大,英伟达的风险收益比,没那么让人安枕无忧,安全边际不足。
2000年很多人对宽带的投资和广泛应用预期,站在今天来看,多数成为现实,但90%以上的投资和公司,可能都成了炮灰,当炮灰大规模破产时,明星股也可以腰斩。

全部讨论

跟两位大佬的观点不同,我认为英伟达是当前美股无热点可炒之下,资本方在后面推动的一个巨大的泡沫
英伟达和老黄的牛逼毋庸多言,哪怕是苏妈也跟老黄差着档次。但是2.8万亿的市值需要日常影响数十亿的人的工作生活才能匹配。当前的大模型跟世界上99%的人当前都没有关系。
如你最后一段所写,我认为当前AGI不会是通向真正机器类脑智能的解法,不过是统计语言模型更复杂的一类表现。在算力和数据突飞猛进之后,当前的统计语言模型比之前有非常大的提升,但是你能看到的不过是更长上下文的token预测,依赖于模型学习过的类似上下文下各token出现概率。跟真正人类可联想,可类比迁移的思维模式有很大不同。你能看到大语言模型给你输出一大段符合语法的文字,实际内容或空洞,或者你无法判定其真假,因为训练模型时候无法对海量的文本进行真伪校验
如果你有很强的分别真假能力,大模型可以是一种更高效的搜索引擎。如果你的日常工作可以被大模型替代,你第一时间要怀疑的是你自己工作是否有价值。无数的政府公文,还有很多大公司的paper work实际上都是无实际价值的繁文缛节而已。码农的工作可以被提速,因为码农日常写的代码,很多需要有一个框架,然后在其中填一些业务代码。
老黄的“你买的越多,省的越多”说了很多次。这次财报会议上,英伟达的CFO也在重复同一句话,就是硬件厂商买新计算卡,1美元的卡卖算力能卖出来多少钱。这个价值链条完全是无根之水。
正常的价值链,给用户创造了100元价值,用户可能给AI公司支付50元,另外50元是使用产品的收益。AI公司支付30元给算力公司 ,20元是利润。算力公司支付20元给英伟达,10元是利润。现在英伟达的价值链到不了用户这一层,为当前大模型服务支付的用户和金额完全支撑不起来整个链条进入正循环。资本从股价上对所有和AI相关公司施压,逼迫所有公司无论主动还是被动的去投资金到这个链条,AI公司赔钱,算力公司赚钱,英伟达赚大钱。AI公司无法从用户那里赚到推动这个链条循环起来的钱,单靠AI公司被股价逼迫很快资金就会枯竭。在帮助AI公司从用户手上赚到钱之前,英伟达的股价无比虚。
我佩服在这个大潮之中赚到钱的大佬们,但是资金的操作还是以实际技术价值为锚。祝各位大佬好运,在资本收割完成前都能卖在顶峰。

网页链接
《NV的破绽》,求赐教:“翻番”大佬,您对这个专业人士的分析如何解读?
多谢

@翻番 最近各大头部企业发布季报,N和A也都震盪整調整了許多,对于今后的走勢,請赐教,謝謝你

附这篇非常具有启发性的分析文章,解惑了我与各位小伙伴讨论中的一些关键问题,特予分享。The Data Center is the New Compute Unit: Nvidia's Vision for System-Level Scaling:网页链接

算力的竞争已经在尺度到单个计算中心,那tsla所谓让所有车主成为分布式算力租赁提供者,不就是一个笑话了么?更别提其中的算力同步、数据同步需要的带宽需求

多好的文章。

05-31 00:56

翻番大佬我又来了,30日Meta ( $META )、 #Microsoft ( $MSFT )、 #AMD ( $AMD ) 和#Broadcom ( $AVGO ) 等科技公司推出“Ultra Accelerator Link” ”,数据中心网络的新标准#IA 。这项努力旨在打破#Nvidia ( $NVDA ) 的主导地位。随着客户购买AMD服务器,还有博通定制化的tpu,并且以后还要不断更新服务器,那服务器之间的串联显得越来越重要。老黄在这次财报也提到他们的infinity的巨大优势,可是财报显示这块份额并没有他说的那么乐观,请问大佬这个联盟您是怎么看的呢?
我这里先抛砖引玉了,

04-14 10:34

我之前看了NVIDIA的新一代架构,然后新结构机箱方面我买了戴尔科技和超微电脑,液冷买的维谛技术,铜链接买的安费诺,AI芯片制造买的上游的ASML和下游的TSMC,还有提供材料的应用技术,提供谷歌配套的博通。此外我还买了发电厂股票vistra。

04-13 21:49

如果按博主所说英伟达目前类比处于X86规模化英特尔前期,因为目对应的软件类公司还不明显,那么鉴于英伟达目前的市值。预期应该也只是跑赢纳指这么简单,那如果在现价建仓英伟达其实是不是并没有更大的股价空间,仅是跑赢纳指这种预期,那么现在想建仓英伟达做长线的话是否可行

06-09 18:18

翻翻大佬,英伟达产业链上国内受益的公司请您抽时间也分析一二。