讨论详情 - 雪球

作者：关山

发布于:2024-05-23 09:55

雪球

回复：0

喜欢：4

大模型的全称是大语言模型。语言的边界在哪里，大模型的边界就在哪里。超过语言边界的东西，大模型估计就不行了

热门回复

关山

05-23 12:47

查看讨论

我说的超出语言的东西，是一些说不清的东西。比如梵高那种乱画出来的画，大家说不清那是什么，完全就和真实的不像，但是就有很多人很喜欢。我国有个著名小提琴家叫薛伟，他说很不喜欢别人用语言来描述音乐，哪怕再精准再华丽，他都觉得会让音乐索然无味。说得清的，我们都能解构分析，都能写个程序出来，说不清的，咋写程序呢。。。。

关山

05-23 12:30

查看讨论

我不太清楚自动驾驶模型是怎么回事儿。目前来看，大模型的主要输入方法还是文字，不论是英文还是中文，输出可以有很多种，比如图片视频文字什么的。所以大模型我估计理解输入信息的方式还是一种类文字形的。图片那边，我估计也有个方法把图片转化成一种语言给大模型来理解吧？

shhnf

05-23 12:38

查看讨论

您说的文字输入指的是用户端吧？模型训练的时候，感觉各种内容都是要先转化成0101的数据结构的，既然文字可以，那么图片、视频应该也都可以吧，只不过转化的模式、难度和数据量不是一个级别的，文字最先跑通transformer+scaling law的模式。当然文字和图片、视频数据也可以混合标定来增强理解能力

shhnf

05-23 12:27

查看讨论

那些多模态的大模型和语言的关系是不是没那么大，比如特斯拉的端到端自动驾驶模型。印象中大模型的核心是transformer结构和scaling law，这两个东西和语言的关系是绑定的吗？感觉输入输出应该不仅限于语言，也可以是图片、视频等等？

shhnf

05-23 13:05

查看讨论

我感觉可以这样理解：您说的这些主要还是涉及到人类意识、情感、文化、哲学等的范畴，这些范畴是否能够拆分到更细的范畴，用科学表达范式或者语言逻辑范式进行表达，现在的人类意识水平和科学水平肯定是搞不定的

关山 的讨论

作者：关山

热门回复

关山的讨论