思山睿雨 的讨论

发布于: 修改于:雪球回复:0喜欢:2
这一段值得收藏学习[很赞],感谢Andy 分享,转起[抱拳]
$特斯拉(TSLA)$FSD v12应该是一次智能驾驶理念大升级,系统结构也发生了变化:
技术上最大的变化是采用了“端到端模型”而放弃了基于规则的算法。实际体验的显著变化是“更像人类”、驾驶流畅、人车博弈场景等观感上的体验的确有提升。
我们知道过去自动驾驶领域的规划控制部分一直是基于规则算法的,包括L4公司以及FSD 以前的版本,需要写大量的代码来解决不同场景的车辆控制问题,但到了一定程度之后发现模型进步很慢,因为corner case茫茫多,且不同规则之间互相影响导致有些场景解决好了,又出现问题
那“端到端”就是通过transformer直接丢入数据进行大参量模型的训练,相应的模型提升方式变成了:发现corner case→收集更多针对该场景的数据→模型训练,到这里才正式形成了数据闭环(这就可以理解过去为什么“遥遥领先公司”数据没那么多,但因为有很大的写规则算法的团队,23年的智驾效果就很快超过了xp)但目前相当一部分人对于“端到端”自动驾驶模型的错误认知是,模型输入各种传感器信息(图像、雷达,mems传感器等等),直接输出各种规控指令,是一个单一的大参数量的神经网络大模型。但实际上目前的FSD v12的感知和规控还是分立的模块,如下图是2023CVPR最佳论文UniAD所展示的模型结构,感知被分为BEV特征构建、目标检测、地图特征提取、轨迹预测和占位网络,这些子任务网路通过transformer模型的中间层参数链接在一起,依然是一个复杂的人工结构。
后面还分析了,自动驾驶面临的问题,对系统成熟的预判。[很赞]#新能源汽车# #智能驾驶# $比亚迪(SZ002594)$