回复@Frank_X: 我都看不懂你说的。。。推理一定是消耗算力越来越低的,一块GPU支持的并发推理越来越高,最后低到设备端的移动级GPU也能推理,我理解你的意思是不是也是这样?如果是这样的话,为啥还要【从单芯片升级为package乃至数据中心】?//@Frank_X:回复@仓又加错-刘成岗:第二点持保留看法哦。现在可能如此,以后需求应用的爆发对推理的要求和需求都会大增,单卡提升太慢了,老黄家的解题思路是用NVL把计算单元从单芯片升级为package乃至数据中心。随着推理算力成本的急速通缩,低成本和大用量会成正循环,如今云上吃算力的大活儿也会被下放至端侧。