聊到我专业了……其实很多人不知道,特斯拉很早就实现了成熟的数据脱敏,2023年也第一次公开说明了他们有这个能力。即使在北美,收集的数据上传到服务器时也会经过脱敏再存储。所以这从来都不是安全问题,安全一直是达标的,现在才允许传回美国,主要还是别的方面达成了一致。
如果是这样的话,我之前的预测可能就错了。之前看到新闻说特斯拉在国内建了数据中心,并实现了数据的本地化存储,我以为训练就只能在国内了。因此就需要考虑国内算力、算法模型保密等问题。如果是通过数据脱敏回传美国的话,这些问题就都不用考虑了。所以数据中心其实是保存原始数据,而需要训练的时候就脱敏然后传回美国。如果脱敏的效果不好,需要调整脱敏的方法,那么原始数据也没有丢,还是保存在国内的数据中心。
脱敏的原理其实也很简单,我们平时在抖音上看到的换脸就是相同的技术,他们只要把所有行人的脸都换成拜登,或者随机一个路人甲就好了。这种视频的处理,对于特斯拉团队来说,简直不要太简单……
道路信息也是一样,说白了就是把路牌识别出来,将带有道路名称的路牌都模糊化就好了(这种识别v11都有现成的模型)。真正运行的时候,主要是依赖导航指引,带有标识性的路牌根本不重要。只要马路上的转向箭头、限速路标这些保留就足够了。