关山的讨论

作者：关山

发布于:2024-05-23 12:30

雪球

回复：0

喜欢：1

我不太清楚自动驾驶模型是怎么回事儿。目前来看，大模型的主要输入方法还是文字，不论是英文还是中文，输出可以有很多种，比如图片视频文字什么的。所以大模型我估计理解输入信息的方式还是一种类文字形的。图片那边，我估计也有个方法把图片转化成一种语言给大模型来理解吧？