ffffdddd 的讨论

发布于: 雪球回复:0喜欢:0
我的理解,所谓的端到端,也是分为特征识别模型,空间占用模型,规控模型等几个部分的。目前真正需要大算力重新训练的的是规控的大模型,而规控模型的数据来源就是前两个模型推理的结果。前两个模型推理的结果已经完全没有了数据安全的问题,按照法规是可以出境的,可以在美国训练。有懂这一块的可以说一说。$特斯拉(TSLA)$ $百度(BIDU)$ $英伟达(NVDA)$

热门回复

没那么简单吧,就目前的occpancy来看,还是要为下游的3D语义分割和光流服务的,下游这玩意要想跑的通,还是得要label,这部分是否会出境?如果是在境内训练下游部分,那推理时在哪里解码?就算在境内解码,这些带语义的结果终究还是要被带出去吧,难道规控部分完全不需要环境的任何语义信息?

这样就明白了,就是带着模型来了,在境内做微调。

即使费劲全部拼接上了,这种啥也没有的地图也算是敏感数据?高德百度哪一个不比这种更精确更丰富。

感知和环境建模部分只要有足够的数据,微调效果应该还是不错的。对规控部分不是很了解,重点应该主要是微调适应国内驾驶人和其他交通参与者的行为习惯?

都一个个小方块了,有啥敏感的啊

真的不敏感吗[笑哭]只要数据是连续的驾驶视频,那推理结果就相当于对环境的有效建模了,只要想办法确定一下绝对位置,整个地区的地图就出来了。既然是要用来规控,总不可能是一张张随机的图像,甚至都不会是小的视频片段(训练效果不好)吧。所以最好的办法就是上面和马斯克提出的大模型入境,境内微调,要出去也只能是模型出去,不带走任何数据。

但3D占用本身就是敏感环境信息吧?这玩意儿允许出境?

对大模型来说就只是输入输出的事,只要格式统一,所有的东西都是能够训练和模拟的

推理的结果数据无非就是告诉规控红灯,人,车,路面信息,肯定是带语义标签的,这部分数据是没有任何敏感信息的,甚至连地理位置信息都不需要,有何敏感的。

就好比一个在美国会开车的老司机来中国熟悉下交通规则和路况,上手会快,端到端的优势就是只要有数据,计算复杂度是始终保持一致的,不至于到美国行,到中国就因为路况复杂就不行[大笑]