Augustusss 的讨论

发布于: 雪球回复:9喜欢:50
本来想写点什么的,既然老师写这么好,我也不用献丑了,稍微补充点我的认知:
简单的说,GB200真正的买家不会只买一个机柜回去,认为这点算力就够用了。
真正的买家会以万、十万为单位去买卡,然后通过集群形成大规模的算力。
单机柜的算力被放大,只是更方便集群更大规模的算力而已。
因为集群算力规模更大,光的用量只会更多,对光模块速率的要求也只会更高。
光进铜退是大势所趋,铜永远无法解决能量损耗问题,这个是物理性质决定的。而光可以通过更高速率(1.6t、3.2t)、更高集成度(硅光cpo)解决自身短板。
AGI是新时代人类的登月计划,赢者通吃。第一家实现了,第二家没什么意义了。
所以,有志于实现AGI的竞争者是不会考虑投入产出比的,只会按照Scaling Laws不停追加算力投入,扩大算力规模。
老黄专门提,已经有人用GB200训练27万亿参数的模型了。
没别的意思,该卷起来了。

热门回复

中文真的会上百元吗?

为什么要科普,我今天中际还没捡够呢

一百块的时候没买够?

学习一下两位大佬的分析

一直期待有个能配图的,真的不错,爱了爱了~

学习了

GB200对于光模块的需求说明

人的大脑神经突触总数量是百万亿级别,我想大模型的参数也要向这个级别进发,才有实现agi的希望

深以为然。