回复@非典型伪价值投机: 大模型的全称是大语言模型。语言的边界在哪里，大模型的边界就在哪里。超过语言边界的东西，大模型估...

作者：关山

发布于:2024-05-23 09:55

iPhone

转发：0

回复：5

喜欢：0

回复@非典型伪价值投机: 大模型的全称是大语言模型。语言的边界在哪里，大模型的边界就在哪里。超过语言边界的东西，大模型估计就不行了//@非典型伪价值投机:回复@秦子博:量子计算是超级CPU，可能可以力大飞砖。但肯定不是人类大脑的做法。人脑是存算改，三位一体。如果人脑是一台芯片，它的线路图不仅可以生长，还能不断修改。而不是一块死的芯片。

引用：

2024-05-23 07:56

$英伟达(NVDA)$，不管GPU拆的运算单元再细，把存储和运算单元封装的再近，它本质上也还是一个冯诺依曼架构，也就是说，算归算，存归存。
那么当模型参数不断变大，一次训练需要读取的参数就越多，假设如果你的大脑左脑负责运算，右脑负责存储。每次你想问题都需要把右脑的信息，先加载到左脑，...

全部讨论

shhnf

05-23 12:27

那些多模态的大模型和语言的关系是不是没那么大，比如特斯拉的端到端自动驾驶模型。印象中大模型的核心是transformer结构和scaling law，这两个东西和语言的关系是绑定的吗？感觉输入输出应该不仅限于语言，也可以是图片、视频等等？