JZee 的讨论

发布于: 雪球回复:0喜欢:1
哦,是这个意思。那transformer出现前的ulmfit应该已经证明了计算机这样学到的语言模型是有很强的迁移学习能力的,能完成没被训练的任务。后来的研究进一步发现这些模型还有跨语言的能力,在一种语言学到的结构和能力能在缺乏训练材料的新语言里用出来