莫名其喵 的讨论

发布于: 雪球回复:18喜欢:3
我重新看了一下18年Andrej Karpathy的一个演讲,对测试视频中车辆出现的漂移和异常转向等现象有了一个猜测。

可以注意到,视频中出现车辆操作异常的时候,其实视觉感知都是没问题的,问题是出在驾驶行为、尤其是转向行为的自动决策上。

在下图Andrej的ppt中可以看到,当年特斯拉正在逐步把手工编写的逻辑替换成机器通过训练习得的操作逻辑,而steering这部分是替换的比较慢的。

我猜测,这些年里特斯拉autopilot团队的主要精力放在了感知上,而没有怎么改进车辆操作。车辆操作部分的很多逻辑可能还是手写的。所以最终呈现的结果,就是视觉感知非常棒,但车辆操作还有些莫名其妙的低级错误。感知的提升使得对车道线、道路交通的其他参与者有了更精确和稳定的识别,于是非复杂路况下,手工编写的代码表现得更平滑了(输入的数据更少跳跃)。然而相对复杂的路况下,手工代码无法应付复杂状况的缺陷并不能通过出色的感知来弥补,这就体现在车辆的莫名漂移和过度转向等等。

感知这一块特斯拉确实完成了很多非常有挑战性的工作,比如距离信息的计算,从2D labeling转向4d labeling等等,更不用说各种corner case。而Beta 9相比之前的版本在感知上也有非常大的变化,实现了包括八个摄像头的融合、去除雷达等新功能。而出色的感知又是车辆操作不可或缺的基础,所以特斯拉集中资源解决感知的问题是完全可以理解的。

目前来看,感知这一块特斯拉已经有了长足的进步,也许我们可以期待一下车辆操作部分的更快改善了。
我重新看了一下18年Andre

热门回复

2021-07-12 00:16

突然感觉我对自动驾驶的理解又深了一层[俏皮]

由于车辆“操控网络”的输入是感知网络的输出,所以必须用感知网络的输出来作为training set的feature set,而不是真实图像。所以自动操控的进步一定是会晚于感知的。

2021-07-11 23:48

雪球上难得有一个真正懂得特斯拉自动驾驶方案的人[大笑],v9 beta只是第一个版本,相信在这个基础上迭代2-3个版本之后优势会越来越明显,那个时候我们在回过来看吧。

道理上似乎不应该。既然大框架是无监督机器学习,那么把感知和操作割裂开来是有问题的,一定会有大量不匹配的状况出现。逻辑上应该是感知和操作一起利用机器学习框架才对。无论从数据还是算力,这都不应该出现瓶颈。而且,利用影子模式来反馈纠偏机器学习的结果也是顺畅的。既然最终都是走向无监督机器学习,为什么不一开头就全力转向而是分段完成呢?这种过渡只会妨碍整体进度。$特斯拉(TSLA)$

2021-07-11 22:44

在车辆操控逻辑完全切换到神经网络实现之前,估计不会有大的改变,但切过去之后应该会进步神速

2021-07-11 22:08

老兄很专业,分析的很有逻辑,如果真是这样应该不用多长时间就能修复这两个看起来比较低级的问题

这个版本决策也是机器学习的吗?

这个逻辑是合理的。

2021-07-13 01:29

地面标线不清晰

复杂吗?

2021-07-12 21:29

手写代码恰恰在复杂路况的情况下无能为力