发布于: 雪球转发:0回复:2喜欢:0

大语言模型一开始是个非常简单的编程,10-15年前,我们其实是用它来做语言翻译的。

但是随着模型的不断练习,出现了一些有趣的变化。语言模型不仅做了翻译,同时还可以基于这些语料做推理。

因为语言不是单纯的进行信息的传递和传达,我们之所以会有语言,是希望语言表达思想,没有语言,思想也是匮乏的,所以语言跟推理能力密切相关。

当获得了语言能力时,它也在一定程度上获得了推理能力。这是开发人员们没有意识到的。所以推理是语言模型研究过程中获得的一个有趣副产物。

全部讨论

04-15 15:17

不是因为2019年谷歌员工设计的transformer才有了现在的大语言模型吗