Shawn_Li_ 的讨论

发布于: 雪球回复:22喜欢:2
纯视觉和rule-base是两个方面的事情,没了解清楚就下投资决策不明智

热门回复

并不完全是你说的这样,现阶段纯视觉方案可能是通往端到端模型最正确的技术路线。如果在感知端加入激光雷达和毫米波雷达,多模态的端到端模型训练难度会大幅度增加,现阶段的算法和算力并不一定能满足要求。还有端到端模型的训练是由海量高质量的行驶数据驱动的,基于纯视觉的人类驾驶数据很容易获得,而基于激光雷达的高质量数据难度就要大很多,毕竟没有人类驾驶员会基于激光雷达的感知信息来驾驶车辆。

那么在纯视觉方案基础上结合激光雷达在极端情况下进行决策补充,哪里不可行呢

比亚迪虽然车多,但是因为成本关系,绝大部分车型都没有对自动驾驶进行硬件预埋。而且比亚迪车型太多了,不同车型传感器布置差距很大,这对数据采集和标定影响很大。不过如果国内主机厂都跟着特斯拉卷端到端,对比亚迪这种前期在自动驾驶投入不多的玩家反倒是个优势

行车记录仪的数据没有用。训练模型需要大量标定一致,FOV焦距感光度等规完全格统一的车规级AD摄像头的采集数据。这方面特斯拉有很深的护城河,毕竟几百万台车在路上跑了这么多年,积攒了十几亿英里的高质量数据。我甚至觉得,这个比特斯拉在算法或者算力层面上的优势更重要。

我觉得没有那没简单。激光雷达的感知数据中有多少是用纯视觉系统无法替代的有价值的信息,又有多少是噪音信息,本身就有很大争议。而且激光雷达无法识别悬崖急转弯这样的极端工况,无法识别道路标识,雨雾天气性能也会大幅下降,如果一个AD系统需要一个rule base的激光雷达系统来兜底,本身这个系统就不太可能会达到L4或者L5。我们这些讨论的前提是相信人工智能的scaling law, 相信端到端大模型是通往L5自动驾驶的正确方向。如果这个前提被证伪了,那确实只能回去卷rule base的hard coding了

雷达拓宽了安全上下限,当然比纯视觉好的多

同意,至少可以做补充。所以说主要原因是降低成本而不是啥第一性原理。

纯视觉对应激光雷达混合,rule base对应端到端,两码事。萝卜是模块化端到端。特斯拉这条路太激进

没有训练数据,这样又会绕回rulebase

我不是已经回答了吗?你是哪里没看懂[狗头][狗头]?