发布于: 修改于: Android转发:0回复:2喜欢:2
年初Sora的惊喜,让我真的以为AI可以理解物理学定律。但随着苹果放弃造车,GPT进化放慢,以及L3级别的FSD无法落地,让我非常明确人工智能是低于预期的,远低于预期。
但是为什么?一直搞不清楚。
看了何恺明在港中文的交流,我模糊的有点清楚了,问题出在:抽象和开放。
先说抽象。
大语言模型核心处理的是语言。语言是人类对自然以及社会的抽象。理解语言是非常困难的事,即便对人类也是如此。正如我们虽然学了很多年英文,但交流起来依旧困难,理解了表面意思,却理解不了“意思意思”“有点意思”和“什么意思”。
所以我深度怀疑,大语言模型其实根本没有理解语言,这就是何恺明讲的,没必要追求大模型的“可解释性”,因为根本解释不了。
我怀疑,大模型只是利用了人类语言的匮乏。
正如《新华字典》里的常用汉字,无非5000字,写一首诗无非是这5000个字按照一定规则的组合。
所以唐诗宋词元曲明清小说,是明清时期的人不会写诗吗?不是,而是汉字就那么多,基本唐宋时候的人,把可能的组合基本探索完了。
李白:天地一逆旅,同悲万古尘
苏轼:人生如逆旅,我亦是行人
连苏轼都得抄李白的,后人就更难有新意了
所以人类的语言是一个相对封闭的系统。就像AlphaGo面对的围棋棋盘,他是相对容易的。
所以何恺明提到一个问题,如果在牛顿时代就有了大模型,他掌握了当时所有的数据,他能创造牛顿定律吗?我想答案应该是否定的。
因为大模型根本就没有理解这些数据,他只是起到了检索和更好的输出的功能。
当然这已经很好了。
然而,真实世界是开放的,视频已经比语言要复杂得多,而真实世界比视频数据还要复杂得多的多。
当面对开放世界时,大模型由于根本不能做到人类意义上的理解,所以可能出现两种情况:
1、生搬硬套,用过去的数据定义现在
2、无所适从,无法在短时间内做出一点反应
如果仅仅是一个搜索引擎还好。
可如果是L5级的自动驾驶呢?车上坐着你的全家人。
如果是家用人形机器人呢?它正抱着你的宝宝喂奶。
这些我认为最早可以落地大模型的场景,看来在底层逻辑上就不现实。
短期内,大模型只能像手机Siri或者车载NOA一样,作为附赠的软件产品出现。
没有付费场景,算力建设会告一段落。
$英伟达(NVDA)$ $中际旭创(SZ300308)$ $苹果(AAPL)$年初Sora的惊喜,让我真的以年初Sora的惊喜,让我真的以年初Sora的惊喜,让我真的以

全部讨论

05-19 15:18

最聪明的人更应去搞清洁能源的研发

05-19 15:49

战颅和千手观音