讨论详情 - 雪球

发布于:2024-04-08 14:27 修改于: 2024-04-08 14:30

雪球

回复：0

喜欢：0

我同意现阶段不会是100%，仍然会有heuristic layer，但是最终目标肯定是无限接近100%。另外，据我了解的是，目前已知的所有端到端的大模型都不会预留信号结构，这本质上是强行让大模型的能力退化。无论是gpt-4还是claude 3，一般的共识就是他们都完全没有自我解释性。学术界现在有一些尝试，是通过训练另一个模型，来对不可解释的模型做一些预测性的理解，比如在语言模型上将“吸引注意力”的token进行高亮，但是这和你说的不是一码事。

Raines雷的讨论

作者：Raines雷

Raines雷 的讨论

作者：Raines雷

Raines雷的讨论