发布于: | 雪球 | 回复:0 | 喜欢:0 |
没那么简单吧,就目前的occpancy来看,还是要为下游的3D语义分割和光流服务的,下游这玩意要想跑的通,还是得要label,这部分是否会出境?如果是在境内训练下游部分,那推理时在哪里解码?就算在境内解码,这些带语义的结果终究还是要被带出去吧,难道规控部分完全不需要环境的任何语义信息?
真的不敏感吗[笑哭]只要数据是连续的驾驶视频,那推理结果就相当于对环境的有效建模了,只要想办法确定一下绝对位置,整个地区的地图就出来了。既然是要用来规控,总不可能是一张张随机的图像,甚至都不会是小的视频片段(训练效果不好)吧。所以最好的办法就是上面和马斯克提出的大模型入境,境内微调,要出去也只能是模型出去,不带走任何数据。