2023-04-27 19:27
GPT-4的训练文本里大概有92%是英文文本,中文文本占比较低,因为人类近代史上200年的现代文明,大多数的科研技术成果以及人类的智慧都是以英文方式书写。这对于其他所有语种来说是一个非常不公平的现象,大模型的出现解决了这种不公平。无论是使用国内的大模型还是使用国外的大模型,其知识来源是以全球各种语种的知识为源泉,这就真正打破了英文的知识垄断,从而使全球任何语种的用户都能使用大模型来学习进行知识迁移。
GPT-4的训练文本里大概有92%是英文文本,中文文本占比较低,因为人类近代史上200年的现代文明,大多数的科研技术成果以及人类的智慧都是以英文方式书写。这对于其他所有语种来说是一个非常不公平的现象,大模型的出现解决了这种不公平。无论是使用国内的大模型还是使用国外的大模型,其知识来源是以全球各种语种的知识为源泉,这就真正打破了英文的知识垄断,从而使全球任何语种的用户都能使用大模型来学习进行知识迁移。