年初Sora的惊喜，让我真的以为AI可以理解物理学定律。但随着苹果放弃造车，GPT进化放慢，以及L3级别的FSD无法...

年初Sora的惊喜，让我真的以为AI可以理解物理学定律。但随着苹果放弃造车，GPT进化放慢，以及L3级别的FSD无法落地，让我非常明确人工智能是低于预期的，远低于预期。
但是为什么？一直搞不清楚。
看了何恺明在港中文的交流，我模糊的有点清楚了，问题出在：抽象和开放。
先说抽象。
大语言模型核心处理的是语言。语言是人类对自然以及社会的抽象。理解语言是非常困难的事，即便对人类也是如此。正如我们虽然学了很多年英文，但交流起来依旧困难，理解了表面意思，却理解不了“意思意思”“有点意思”和“什么意思”。
所以我深度怀疑，大语言模型其实根本没有理解语言，这就是何恺明讲的，没必要追求大模型的“可解释性”，因为根本解释不了。
我怀疑，大模型只是利用了人类语言的匮乏。
正如《新华字典》里的常用汉字，无非5000字，写一首诗无非是这5000个字按照一定规则的组合。
所以唐诗宋词元曲明清小说，是明清时期的人不会写诗吗？不是，而是汉字就那么多，基本唐宋时候的人，把可能的组合基本探索完了。
李白：天地一逆旅，同悲万古尘
苏轼：人生如逆旅，我亦是行人
连苏轼都得抄李白的，后人就更难有新意了
所以人类的语言是一个相对封闭的系统。就像AlphaGo面对的围棋棋盘，他是相对容易的。
所以何恺明提到一个问题，如果在牛顿时代就有了大模型，他掌握了当时所有的数据，他能创造牛顿定律吗？我想答案应该是否定的。
因为大模型根本就没有理解这些数据，他只是起到了检索和更好的输出的功能。
当然这已经很好了。
然而，真实世界是开放的，视频已经比语言要复杂得多，而真实世界比视频数据还要复杂得多的多。
当面对开放世界时，大模型由于根本不能做到人类意义上的理解，所以可能出现两种情况：
1、生搬硬套，用过去的数据定义现在
2、无所适从，无法在短时间内做出一点反应
如果仅仅是一个搜索引擎还好。
可如果是L5级的自动驾驶呢？车上坐着你的全家人。
如果是家用人形机器人呢？它正抱着你的宝宝喂奶。
这些我认为最早可以落地大模型的场景，看来在底层逻辑上就不现实。
短期内，大模型只能像手机Siri或者车载NOA一样，作为附赠的软件产品出现。
没有付费场景，算力建设会告一段落。
$英伟达(NVDA)$ $中际旭创(SZ300308)$ $苹果(AAPL)$ 年初Sora的惊喜，让我真的以

作者：源凯恩斯

全部讨论