周末关于NV的多和空

发布于: 雪球转发:0回复:6喜欢:16

先说个干货

某行测算了GPT-5和GPT-6训练所需算力,GPT-5核心假设:8.8-17.6万亿参数、65T-130T token。由于参数量和数据量的增长是5-10x,总算力的消耗相比GPT-4就是25-100x,大概需要20-30万H100,训练4-6个月时间。

GPT-6,基于Blackwell以及再下一代Blackwell+1、Blackwell+2的算力需求。核心假设参数到67-130万亿,数据token量到494-960万亿,因此算力需要是GPT-4的1444倍-5400多倍,对应需要158万张Blackwell或96万张的Blackwell+2代产品。以及需要IDC容量是可怕的3.5GW-4.2GW。怎么说呢,合理的地方在于惊人的数量级假设倒是呼应上了星际之门、AWS、谷歌千亿美金、微软180万张卡等多颗大卫星。但这里面很多还没准备好。只说电力,目前千兆瓦级训练集群一个都没有(但的确都开始了GW级的建设,AWS的核电站是950MW,小扎在Llama3采访上也提到了即将到来的千兆瓦集群)。以及这可怕的500-1000万亿token数量从哪里来,显然95%以上要来自生成数据or合成数据。卡、电、数据,就是摆在GPT-6面前的三道关。

而上述只是“蛮力”,纯自回归模型scaling就可以了吗?最近也收到了非常多产业界朋友的反馈,显然不够。因此过去那些碎片化的传闻,解决的都是同一个问题——system 2系统二,比如OpenAI的Q-star,老黄斯坦福说的“Long thinking”,还是Yann Lecun经常诟病的“planning能力”,谷歌和princeton提出的“Tree of Thoughts”。这是蛮力之外的“巧劲”,也就是模型层面的理论创新,有可能会从GPT-6进入工程实现。

总结来说,抛开炒股票,未来2年有太多问题让产业界去解决,发展变革的速度可一点都没有放慢。作为我自己,也会不自觉得去找一个短期的锚——GPT-5,但显然这已经是训练中或训练好的模型,其所能验证的也是过去那一套,H100+几十T数据+可能变化不大的模型架构(这点我不确定),所能实现的能力。而Blackwell+更大比例的合成数据+新的模型架构,能带来的能力提升,或许更能说明scaling-law最新的二阶导在哪里。当然这个实现代价如上所示,从电到卡都是非常巨大的。而数据其实给了我们更大信心,先不说Llama3 70B到底如何,至少其15T数据+不变的参数量带来的MMLU提升,说明只怼数据这一个维度对模型拉动的效果其实还没到天花板,这一点很关键。

进入正题,关于英伟达-10%后的看法,在星球发起了投票,参与度空前...

因为星球内包含了产业人士、VC/PE投资人、二级机构投资人、个人投资者,混合了短中长期不同视角。且读者真的藏龙卧虎,可能很多发言是隐藏大佬(当然现在这种混沌时刻,权威也没啥用,大家多听多看吧)

从投票结果看,选择明确看空和看多的1和3都是少数,多数人选择了2,但即便选2的读者,也基本都表达了短期悲观的态度。因此我将观点整理成了多空两派供大家对比参考

多方:

大宗黄金猛涨 。交易的就是你美元的信用性风险,美股被挂在高位难受了,对 ai 来说就两种,跌下来等美元的风险落地,利率下来接着涨,要么应用那边催化叙事再升级,直接拉上去。本质上还是资产荒,人类未来这种救命稻草式的宏大叙事你想结束是真有点难
AGI 的等级划分来看,还处在level 1阶段,还有很长的技术爬坡。个股基本面没啥,不然asml台积电就应该拉崩,而不是smci拉崩不可能那么多巨头一起误判趋势(指巨额投入)联储有意收紧金融条件狙击ai,跌了才有降息的理由。经济有韧性,所以标普的调整不会很深宏观环境不支持直接反弹,HB切换期间不确定性也没定价,这波定价完逐步抄吧,等一个gpt-5公司基本面完全没问题。但是宏观战争,选举,通胀三大风险可能会杀估值multiple选2,周五大跌可能是交易层面促发的,而且交易层面的逆风因素还在,短期涨上去缺乏大的催化,不可能有大量的资金这时候给干上去,向下又有业绩的支撑,估值也不算贵,所以必然是震荡走势选2,短期宏观不乐观,行业目前也没有新故事可以讲,但是好歹是第四次工业革命,调整后等ai有新的突破,继续往上

空方:

选择1和2之間,需要等的时间再长一点,就变1会继续调整,联储为了后续降息钱能继续留在美国做准备大模型在c端的应用已经被pass了,无论是写作,音乐,绘画,都是糊弄外行的渣渣。b端应用目前也只是一些头部公司的自娱自乐,没看出在某个细分领域有出圈的商业模式,应用太差劲,始终是这波大模型热潮的头上的一把刀。AI周期性潮起潮落就已经经历过不少于4次,向量机, 概率图模型, 深度学习和目前的LLM。各领风骚几年,行业热点不断变换,很多从业者也不得不主动或者被动的跟随。但在这些不断发展之中,作为从业者/研发者和应用落地者,业内在1984年提出的一些基础问题(The dark ages of AI: a panel discussion at AAAI-84, 这篇文章建议都好好读读),得到了很好的解决了吗?见顶。会做个M头,参考21-22年特斯拉。LLM往前看已经有明显的科学问题了,常理来看,巨头以外的地方冷静2年左右比较正常。csp今年支撑600亿,明年支撑1000亿,后年可能还20%的涨,可是小厂那块儿是非常说不清楚的。这不能说泡沫破裂,但是中间波折一下2-3年也算正常,自动驾驶行业周期,信与不信摆动了N多次了,基本两年换个观点,但是特斯拉,waymo,pony一直在前进。(此处引发了对FSD的有趣讨论如下)

人形机器人,达到人类智商的,值多少钱?纯自动驾驶汽车,又打算出多少钱呢?现实问题是技术和成本不能突破,而收益为负。我认为ai的将来会在小范围应用,全民应用还需要时间。现阶段的建设浪潮已经结束。有勇气的话应该空英伟达AI阶段性调整,相当于AI从0到1的炒作结束,沾AI就上天的股价不会再有了。美股就不评说了,看看A股的概念股,光模块才多大点市场,无法想象zjxc,xys,tftx,jqtx四家光模块公司市值比半导体四大龙头wegf,zycx,zsw,sbgf高得多吗。一堆算力股,尤其是租赁的,都什么玩意,整天瞎涨,跨界收购就能涨几倍,买几台机器租个算力也能涨几倍,站岗的都不知道要多久了选2,先空着再说。涨的够久了,该人心摆动了;整体资金面捉襟见肘,不光AI,生科,btc,日经欧洲指数都大调了,所以不会是3AI已经出现审美疲劳了,需要调整几个月甚至半年时间。经过大幅度的上涨已经空间有限了,英伟达已经两万亿市值了,涨到4万亿?先不说业绩能否跟上,就是业绩跟上了也就是一倍的空间了。大宗商品的上涨给资金提供了新的阵地,先从美股撤退进入大宗商品的资金已经有赚钱效应了,后续资金会陆续从美股等涨幅多的股市撤出来,进入大宗商品市场。资金是为了盈利为目的,至于AI能否改变世界并不重要。资金已经找到了新的现场,等大宗商品涨完了,AI也调整的差不多了,新的应用又出来了,再回来就可以了。纯属娱乐,不许骂人。现在有个基本面的困境,目前模型和硬件条件下没有大规模2C的monetization落地,甚至还看不到苗头,那么产品力就还要提升,模型和硬件提升就还要继续加大投入,但在狂烧了两三年(以及未来两年预期拉满)后继续把硬件和infra做好的成本也是指数增长的,大家又看不到回头钱,外部宏观环境一收缩很难再继续炒硬件scaling law看到killer app才能让资本市场相信这不是一个大bubble,更好的应用需要更好模型能力的支持,更好模型能力受限于硬件升级迭代速度(降本),这个时间周期比预想中长(已经很快了但还是得1年1迭代),那短期股价如果高位很容易被各种短期headwind主导,当然了向下有业绩支撑也不会跌太多。综合起来就是高位震荡到“看见”再继续向上,or巨头们“不相信”(感觉比较难)向下应用落地主要是b端,速度肯定会比较慢些;叠加宏观不确定性(再通胀的自我实现),以及目前来看概率还比较小的衰退风险,可能要到下半年才能看到软/硬着陆的信号水逆期间,就不要逆势而为了!老米一直说:sell in may, go away! 老米嘴巴上说5月卖,身体上4月已经卖完了。

BTW,我记得上一次分析看空观点是12月,之后NV就直接翻倍了。这次看空观点如此多,也是个signal。可能关键又回到了手中有筹码的人,他们所处的宏观、资金、风险偏好、资产比价关系、以及产业和基本面业绩等等环境要素。但有一点确定,AI从0到1的无脑看多阶段过去了,下一步是细活儿,投资的难度增加,研究的专业性要求会更高。最近和很多专业的读者聊了聊,更加认识到这个平台的意义。也顺便求一份上述报告的excel,不是投资用,给一些国内搞大模型的产业人士参考。

(完)

全部讨论

04-21 20:21

看到有人说GPT目前已经亏得不行了,没有财力继续大幅采购英伟达的芯片,不知道大家怎么看?

04-21 19:33

对于头部,下有一定的业绩保底,上等新的突破和业绩确认(也可能没)。横盘震荡吧,对应波段交易机会。

这个数据量假设忽略了当前公开数据大部分已经被gpt4用掉的事实,后续使用合成数据训练时,受限于人力是没有办法再指数级增长的。

04-21 19:54

如果看好,越跌越买不是更符合自身利益?