讨论详情 - 雪球

发布于:2024-03-19 22:14

雪球

回复：9

喜欢：50

本来想写点什么的，既然老师写这么好，我也不用献丑了，稍微补充点我的认知：
简单的说，GB200真正的买家不会只买一个机柜回去，认为这点算力就够用了。
真正的买家会以万、十万为单位去买卡，然后通过集群形成大规模的算力。
单机柜的算力被放大，只是更方便集群更大规模的算力而已。
因为集群算力规模更大，光的用量只会更多，对光模块速率的要求也只会更高。
光进铜退是大势所趋，铜永远无法解决能量损耗问题，这个是物理性质决定的。而光可以通过更高速率（1.6t、3.2t）、更高集成度（硅光cpo）解决自身短板。
AGI是新时代人类的登月计划，赢者通吃。第一家实现了，第二家没什么意义了。
所以，有志于实现AGI的竞争者是不会考虑投入产出比的，只会按照Scaling Laws不停追加算力投入，扩大算力规模。
老黄专门提，已经有人用GB200训练27万亿参数的模型了。
没别的意思，该卷起来了。

Augustusss 的讨论

作者：Augustusss

热门回复