关山 的讨论

发布于: 雪球回复:0喜欢:1
我不太清楚自动驾驶模型是怎么回事儿。目前来看,大模型的主要输入方法还是文字,不论是英文还是中文,输出可以有很多种,比如图片视频文字什么的。所以大模型我估计理解输入信息的方式还是一种类文字形的。图片那边,我估计也有个方法把图片转化成一种语言给大模型来理解吧?