Raines雷 的讨论

发布于: 修改于: 雪球回复:0喜欢:0
我同意现阶段不会是100%,仍然会有heuristic layer,但是最终目标肯定是无限接近100%。另外,据我了解的是,目前已知的所有端到端的大模型都不会预留信号结构,这本质上是强行让大模型的能力退化。无论是gpt-4还是claude 3,一般的共识就是他们都完全没有自我解释性。学术界现在有一些尝试,是通过训练另一个模型,来对不可解释的模型做一些预测性的理解,比如在语言模型上将“吸引注意力”的token进行高亮,但是这和你说的不是一码事。