简单说说微软发布会感受

发布于: 雪球转发:0回复:3喜欢:4

1. 看起来提供了AMD MI300 VM计算服务,更像是陪跑,几个CSP未来加速卡策略大概相同:一供NVDA+二供+自研ASIC,比例不确定,三者得都有。所以你说目前阶段除了分散供应风险,二供和ASIC的真实商业价值有多大?从模型上也一样,一供GPT-4+二供一堆开源+自研phi-3等一堆小模型。实质上策略都是一样的。但从目前来看,同为一供的NVDA+GPT-4/5,正在形成商业、生态上的正循环,其他真不好说。多说一句,有位读者提过,微软的确在fix AMD MI300的软件问题...

2. 英伟达微软进入“全栈合作”,除了GPU、DGX Cloud,Azure AI Platform上支持了NIM,之前我们分享过Al Enterprise是一个端到端的云原生软件平台,如果打开去看其里面的Infra、框架、工具、应用,这就是一个基于GPU的操作系统。上到各家CSP服务是第一步,能否建立操作系统的地位还是未知。之前我们听到过单卡收了4500美金/年的软件收入,更多针对enterprise,对微软谷歌亚马逊能收到这么钱吗?目前还真不确定。但未来随着推理服务的扩大、复杂化,serving本身变成一件极其专业、且严重依赖于GPU infra的事情,“操作系统”的价值会越来越突出。

3. 过去一年,GPT-4速度性能提升了6倍,但cost降低到了之前的1/12,对应性能/成本提升了70倍。这基本符合我们之前说的推理成本基本半年降低一个数量级。考虑到下一步硬件加成、模型架构继续优化,GPT-4推出免费版本的时间越来越近了

4. 微软自身的算力过去一年提升了30倍。且CTO Kevin Scott强调这种算力的扩张“ the end is nowhere in sight”,看不到头。之前大概匡算过微软手里目前等效H100可能到了40-60w张,今年整个还要翻三倍到180w张。

5. copilot从C端进入B端企业工作流,或者从office进入enterprise software。与过去微软发展路径差不多,在大家预料之内。但要注意的是这相比之前office对模型准确度提出了更高要求,说实话个人觉得会比昨天AIPC 类似rewind那种功能更难。比如rewind未来依赖于更多模态统一压缩降维到latent后的大幅降本,可能是个工程问题,而long thinking、复杂推理精确度,需要模型能力实质提高。因此微软target是今年年底推出相关产品,不知道是否与新模型发布节奏有关。

欢迎私信讨论

全部讨论

Amd MI300需要养着,不然nv就判垄断了

05-24 07:00

转,微软发布会