发布于: Android转发:0回复:2喜欢:1
$北京君正(SZ300223)$ 分歧好大。SRAM不是新技术,别人也没说是新技术。核心是,为啥大模型没有杀手应用,抛开训练不谈,推理现在的成本也还是太高了。为毛会高?因为大模型时代下现有的算力芯片在算力方面,存储方面有严重的技术制约,带宽需求就是计算换空间,空间换计算的把戏。如果groq确实如吹的那样能把推理的成本打下来,这才是核心之处。用sram或者其他的都无所谓,等效便宜就行。至于跟君正啥关系,有没有直接关系,先信后信不信呗。

全部讨论

02-20 22:04

很明显新不新无所谓,关键是优化