翻番 的讨论

发布于: 雪球回复:28喜欢:25
怎么会有这么强烈的既视感?似乎看到了英特尔IDM独挑整个芯片制造规模化fabless行业(台积电模式)的故事翻版,谷歌TPU独挑AI规模化GPU标准。连AMD/Pytorch/Triton这些野心家们都要兼容英伟达cuda生态猥琐发展,而曾经执牛耳TensorFlow落败似乎也易于理解了,当你只顾着自己时也就与行业无缘了,谷歌是悲壮头铁又要面子。身体诚实的英特尔除CPU产品外,还是把其他产品外包给台积电自我偷家。谷歌现在是硬着头皮雷打不动非要建立自己的全生态,恐怕仗着自己看家业务现下岁月安好,恐怕还是没被openai揍得太狠。但残酷的现实是,当你拎不清危险到底在哪个方向时,表面上的风平浪静得潜藏何种惊涛骇浪?

热门回复

你的看法包括两个层面的假设,第一层是英伟达可能稳不住通用标准对吧,第二层是TPU会有个别领域的算力性价比让其具备潜在竞争优势。
英伟达体系会否长期是通用标准的问题,我觉得除非当下ai路线证伪亦即无法通向agi,那么英伟达体系标准(我将这个标准定义为一个泛体系,就是跟随英伟达生态的都算,即便AMD这样的竞争者实质上也在兼容cuda)就不会丢掉支配地位。即便从产业角度,毕竟这是一个每季度行业豪赌200亿刀以上的路线,不同于纸面谈兵,这可是真金白银下注。你可以说英伟达的解决方案不完美或有特殊性,但路径依赖造就了当下现实存在的通用标准形成了规模化壁垒,即便未来有单点更好的方案也为之以晚,因为没在恰好的时机干掉需求。何况英伟达集成度虽然高,也不是不卖你单卡,它的解决方案是贯穿单卡到数据中心的。退一步讲,未来如果确有特定领域替代方案,英伟达难道不会定制更小粒度的需求吗?所以压不住的概率即便有现下也丝毫没苗头。
二是TPU或推而广之其他专业芯的性价比问题。我觉得TPU的性价比只存在于谷歌企业内部,所以这种性价比只有谷歌的ai拿到支配地位才有效。否则,谷歌将面临着,用自己传统业务反哺ai研发,来竞争英伟达的通用方案,亦即全行业给后者贡献研发资金。如果谷歌ai不能迎头赶上,则研发资金将逐渐演变成为斩不断的债务。你怎么去招募人才?招cuda技术入厂现培训吗?TPU开发者是不是在当下的时点也该给自己的未来考虑一下,如果TPU路线终结,能秒转英伟达吗?这就是与通用技术抗衡的代价,我们不能仅考察单个计算单元的算力,不能仅对比庞大现金流企业的制造支出没几根牛毛(比如流片成本),这背后最致命的是易用性成本。专用体系的易用性成本在企业内部相对低,在企业外部剧烈增加。易用性成本也是TCO中的重要一环,在前gen-AI时代,市场规模小,这个成本并不突出,但chatgpt出世以降,每过一天英伟达体系就会持续降自己易用性成本一天,从而成为通用体系规模性壁垒的重要组成部分。时值今日,市场领导者openai/微软一系也没说单吊自研路线啊,谷歌为啥不两条腿走路?还不是太要面子?还不是端着前gen-AI时代领导者的位置放下不?

@翻番 过去十几个小时里就对半导体产业有好几个神评论。其中,我个人最喜欢右边这个,尤其是最后一句对谷歌的心态拿捏得非常精准。“时值今日,市场领导者openai/微软一系也没说单吊自研路线啊,谷歌为啥不两条腿走路?还不是太要面子?还不是端着前gen-AI时代领导者的位置放下不?”
我昨天有一个关于GOOG的回复评论,也试图在抓谷歌的这个要命心态,虽然啰嗦了点“....从google持续大投入TPU来看,就是仍然思路不清。google的广告业务才是它的核心,利润率甚高,它应该走的是META的道路,不应该老想着好像当初transformer的paper是它的工程师写出来的(它更应该去思考的是为什么如今那个paper里的工程师全走光了),好像nvda今天的很多东西本应该属于它,这都是幻想和臆想,它应该如META那样主要都采用NVDA的解决方案,破釜沉舟地尽快在自己专业的也是高利润的数字广告/搜索方面干出些可以和openAI/meta/msft竞争的东西。我自己每天使用google搜索的数量都至少减了1/3,都转到直接问openAI或者微软的ai上了。这个是核心得多也要命得多的问题.....”
GOOG上个季度财报最核心的搜索引擎广告业务就已经低于预期了,如果这次财报中的这个核心指标仍显疲态(而我的预计正是这样),就真的如你所说的了“和芯片企业比硬件积累?和满大街cuda程序员比降本?用自己副业和职业选手打擂台时,却连家都被openai偷了我的谷歌宝宝”。那个时候,恐怕Google只有看有否苹果当年的命,期待看创始人有否可能王者归来了.....

深入思考一下,这种产业豪赌往往会发生在曾经的胜利者身上,因为它们曾经太过成功,对自己昔日促就成功的遗产存在很厚的滤镜。以至于在行业转捩点之后,分不清是产业条件发生了根本性变革还是暂时落后,仍不惜拿着股东的钱豪赌(英特尔还是更牛一点,除了败股东的钱外,还拿着美国/欧盟纳税人的钱豪赌,甚至把这一点当作自己的优势写入ppt)。
相比之下,苹果砍掉ev让人钦佩,在gen-AI进退失据时,现下寻求行业合作缓兵跟随,乔帮主没选错接班人。

经营行业支配企业/科技领导企业/超大规模企业岂不也若烹小鲜,以前作为观察者对这一点理解不够深刻。本人作为多年果粉,经历过帮主回归后改变世界的全程,但库克时代的创新回头来看也乏善可陈,从产品角度我曾陷入长期失望。现在想来,在行业成熟期本就不如行业发展初期那般苟日新又日新对吧,能守住基业拥抱乏味也是难能可贵,不因成就个人名声捆绑企业身家对于大权在握的守业人极为不易,我记得你曾提到苹果在辉煌期也没有一体化芯片制造本身就是一种克制(苹果的纵向一体化仅止于设计,某种角度来看,产业大佬库克和金融大佬巴菲特居然在这一点有了些许默契);毕竟,保住本钱才会在产业变革期弹药充足。因此我觉得库克过去的答卷完成得不错,审视未来,当他驻足ev、vr、ai等十字路口时,可谓慎之又慎。虽说当下数落苹果的言论甚嚣尘上,但只要在入口和钱还有重大储备就不能小觑,观察苹果下一步棋的落点也变得饶有兴趣。

面朝gen-AI浪潮,苹果最大的优势是资本+终端客户touch points(其中后者既是优势也是导致自身麻痹/堕入温柔乡最终没落的劣势,所以个人觉得真正的优势在其资本实力),苹果仍有赶上的机会,但剩余的时间真的不多了!
苹果必须要库克孤注一掷,发挥其类创始人的精神,敢于用空间(这里就是它巨大的资本)来换取已经被浪费掉的太多的时间。在兢兢业业的守业方面,库克完成的不错,但即使是乔布斯留下的这种顶级老本legacy也有耗尽的一天,况且科技产业巨变已至,库克此时逼着自己也得豪赌一把,对苹果来说其实取胜仍有机会,但关键在于是否能够彻底放弃幻想,放下端着的昔日霸主面子(Google就死在这里),重新在路上,一段时间内忘记比分牌,就是聚焦在全力奔跑上。未来真的难测,但仍希望乔布斯能够托梦库克做到。

那就更应该反思sora为什么被对手抢了先。谷歌的潜在问题不在于是否搞一套自己的系统,毕竟做自研的又不是只有它,而是它在gen-AI出来一年多了,仍在华山一条路单吊自研。在前gen-AI时代豪赌TPU无妨,皆因谷歌当时是领导者;但当下谷歌已失去这一身份,追赶阶段仍执念太甚,只能祝福它会成功吧。

04-10 13:56

讲到NVIDIA的话,如果NVIDIA主要卖gpgpu卡,全面支持ethernet网络,同时NVIDIA也开放nvlink去支持AMD的gpgpu。那当然就不能说NVIDIA一己之力对抗全行业了。只是那样的话显然NVIDIA的毛利率就会下降很多了。
谷歌这一边软硬一起双脚走,是jeff dean等几位大佬多年前定下的调子了,后来jeff靠边站了,这个策略还继续延续了下来。从成本,自用,外部使用,和NVIDIA的排期等等考虑,谷歌的这个策略都有其道理。我觉得吧,目前谷歌困境的核心问题是大语言模型其实做不出护城河,对各谷歌这样版权顾虑这么多的大企业尤其难,它另外还有内部组织架构问题。板子应该打不到硬件那边去,它全部用NVIDIA的系统也一样做不出护城河。而且也很难说它要是这两年就从NVIDIA那边买,能不能买到它现在拥有的TPU这么多算力。

是的,就和所有人一样,库克虽然也有重大弱点,但在科技巨头企业中,他是所有非创始人CEO中心态最接近创始人CEO的一个(这个我早就有强烈的感觉,之前也提过)。虽然MSFT的Satya Nadella总体观感至少当前还在库克之上,但坦率讲,就主人翁精神,ownership的那种感觉来说,库克都在其之上,他俩目前的差距主要是差在能力方面。这反而说明了乔布斯在看人方面也是登峰造极,想来他当时应该很清楚,他的继任一方面能力当然要很强,但最重要的是对苹果有真爱,真的有近似创始人那种把企业命运扛肩上舍我其谁意识的人,这样的人远比光是顶级能干要更合适得多。多年过去了,现在回过头看,正是这样,即使说当前苹果面临困境。

和芯片企业比硬件积累?和满大街cuda程序员比降本?用自己副业和职业选手打擂台时,却连家都被openai偷了我的谷歌宝宝[苦涩]

感谢回复,get到你的意思了。我认为英伟达当前的方案能跑通还是因为整体疗效最好,如果未来在集成方面的某个环节被对手赶上也是会调整的,体系的演变规律嘛,强则封闭,弱则开放。这次gen-AI来得太突然了,我想整个行业当然来不及预判,毕竟当下的卡都是几年前立项对吧。我的判断是,随着市场成熟,英伟达未来会有大量竞争者,英伟达的margin将来也必降,甚至会逐渐开放体系中的某些环节给业界,但加速计算的通用方案行业主导地位不会变。
在原帖中,我更多想探讨的是TPU这种专用技术的通用化可能问题,谷歌也是有这方面想法的,毕竟谁不想让世界一同分担研发成本,不然不会也出售这部分算力对吧。从这个角度来看,相比英伟达这套方案,谷歌的希望在chatgpt出现后更为渺茫。此外,从谷歌的战略来看,坚持TPU不能说错,没有要打TPU板子的意思。只是多条腿走路对于现下的谷歌更稳妥更有伸缩性,gen-AI应用目前进入到实用阶段,你说LLM没有护城河那就有跟上的可能,万一TPU某天算力陷入不足咋办(比方说某天应用爆发推理算力会不会紧缺)?较早去尝试拥抱英伟达的方案也未尝不可,哪怕作为补充,即便买不足也不至于一张都不自用。这么排斥英伟达,我只能猜测谷歌的管理层是把对方当作彻头彻尾的竞争对手来看待,自然就回避不了探讨专用/通用之争,和专用芯通用化的问题。