那么当模型参数不断变大,一次训练需要读取的参数就越多,假设如果你的大脑左脑负责运算,右脑负责存储。每次你想问题都需要把右脑的信息,先加载到左脑,...
唉,把股民想的太聪明,就是我不聪明的地方。
他想说的是存算一体。就是利用模拟电路的特性(而不是用数字电路),把卷积最基本的乘加运算在存储器内部的管级做了。