帕迪沙阿 的讨论

发布于: 雪球回复:16喜欢:2
大厂扶持amd是否存在一个困境,都希望对手去扶,而自己去买性价比更高的英伟达的卡?

热门回复

各大厂已经在纷纷做xPU了啊,这是事实,不是观点,观点的话就是your margin is my opportunity.

2023-08-26 20:12

性价比可能短期不重要,但长期是约束条件之一,没人和钱有仇。现实案例就是,如果云厂不注重性价比大可继续用高功耗的xeon,没必要迁移到epyc。
NV软件浓度高没问题,本季其70%+的高毛利也在为这点做背书。如果你是一个初创企业,你拿来NV的整套软硬件是无痛的,这一块对竞争对手构筑了很高的生态壁垒。但问题就在于NV最大的那些客户们也都是软件公司,对于云厂和巨企们,他们面对你70%的毛利扼喉时还是有痛感的。云厂有自己的研发实力,更甚者有硬件开发能力(TPU),所以这一块NV的壁垒是更易攻破的,退一步讲也不会让你包圆。AI产业爆发早期,你是唯一的选择,随着竞争者赶上和软件技术的不断扩散,NV的份额会逐渐减少。当然,我也认为NV仍会长期一家独大,但随着这一领域逐渐成熟,利润率会回归,其他入局者也有食可吃。

2023-08-26 18:45

大厂扶植是个伪逻辑,没人有那么多闲钱的。当年英特尔独占99%服务器份额时,没见有什么互联网大厂扶植AMD。但也有赛灵思拿大头,Altera拿小头的另一种行业结构。只要你规模化没拉开,护城河不够坚实,拉不开和跟随者足够差距,后者就能跟随,本质上一切还得靠产品实力。否则,mi250咋没人扶持?到了mi300就都感兴趣起来了?

很多傻子还在算显存和价格来比性价比,没有认识到NV在AI领域是一家软件公司。 在游戏领域,N卡和A卡有性价比的区别,在AI领域不存在,两者就不是一个东西。 99%的人从来连N卡跑一下大模型都没跑过。 跑过的人才知道我说的什么回事。 $英伟达(NVDA)$

现在是军备竞赛时期,谁都不敢冒风险去用AMD的卡,耽误自己的大模型训练进度。开源软件的最大问题是测试不够,bug多,出问题找不到人,大模型训练是个系统工程,没有很好的工具配套,想训练完都够呛。

转服

2023-08-27 09:49

安卓那是谷歌在背后,真不是AMD的水平能比的。ROCm到底行不行可能需要meta费点力气,它这个底层的软硬件等于是刚开始做,和当年Linux的情形还是有点不一样。

2023-08-27 00:34

军备竞赛抢算力没错,当下的确是这样的形势,英伟达占得先机,现在独自赚钱理所应当,但这种局面会否长期持续,高利润率是否合理打个问号。
接下来你狙开源软件可有点准头不够了,前AI时代的服务器最大份额的操作系统是开源闭源?和最大市值上市公司的手机平分天下的移动操作系统是开源闭源?即使进入AI时代,pytorch是不是开源?不能只拎着rocm这个开源毒打吼。
cuda之前能垒起生态体系,除了老黄眼光毒辣较早布局,还是因为这个市场尚不够大。如今,当这个市场TAM二维展开后,大家就都入局来抢食了,开源社区自去年起迭代速度快到没谱,而AMD只是进来搅和大军中较小的那一只,有点大哥带的意思你品品。

2023-08-27 00:20

AMD战线问题可以专门开一个主题谈了。
软件突破的问题,目前不仅是amd的痛点,也是整个行业的痛点。看看几个巨头都在干啥。硬件流:谷歌和亚马逊在自己研发专用芯片(TPU\Trainium\Inferentia)。软件流:Meta在推pytorch支持除cuda、除GPU以外的体系,2.0加入rocm支持等;微软系的openai更是背刺下下英伟达,用自己研发的triton替代cuda,9月份开大会的第一章节,不只找来英伟达,更是把AMD、英特尔等都叫来,准备支持rocm以及什么xpu等(附图)。不做结论,仅供参考。

2023-08-26 20:38

说的很对。但amd的战线是否太长了,在软件上实现突破,感觉很困难,而且软件生态有马太效应。