大语言模型一开始是个非常简单的编程，10-15年前，我们其实是用它来做语言翻译的。但是随着模型的不断练习，出现了一些有趣...

发布于:2024-04-14 11:46

雪球

转发：0

回复：2

喜欢：0

大语言模型一开始是个非常简单的编程，10-15年前，我们其实是用它来做语言翻译的。

但是随着模型的不断练习，出现了一些有趣的变化。语言模型不仅做了翻译，同时还可以基于这些语料做推理。

因为语言不是单纯的进行信息的传递和传达，我们之所以会有语言，是希望语言表达思想，没有语言，思想也是匮乏的，所以语言跟推理能力密切相关。

当获得了语言能力时，它也在一定程度上获得了推理能力。这是开发人员们没有意识到的。所以推理是语言模型研究过程中获得的一个有趣副产物。

全部讨论

04-15 15:17

不是因为2019年谷歌员工设计的transformer才有了现在的大语言模型吗