宇多田：抄袭特斯拉，国内智驾端到端真的别吹了作者：宇多田可能没人比我更盼望FSD进入中国了。如果它在中国的特斯拉上运行良好，就能把一众吹“端到端”的国内友商按在...

作者：宇多田

可能没人比我更盼望FSD进入中国了。如果它在中国的特斯拉上运行良好，就能把一众吹“端到端”的国内友商按在地上暴揍一顿。更何况国内车主还停留在HW3.0硬件配置，如果能打败华为高配，就已经赢了。
如果它不好，也说明不了什么，因为不讲武德的中国城区道路，也就比东南亚和南美好一些。当然，这也注定城区智驾，短期成不了大气候。
更重要的是，“硅谷神话”之所以长期不灭，是因为距离总会产生一些不必要的幻想。
如果受够了“西方把真正重要的东西藏于底层，却用虚幻又不实用的东西洗脑国内无信仰之人”的事实。
那么，这次是个重要契机。真心的，实在不行就打包卖了吧，臣服于座舱。
没有什么像“端到端”一样，能得到宣传口与一线工程师截然相反的评价。
即便两边，都心照不宣默认彼此的行为是合理的。
一家在车展铺天盖地发“端到端”广告的L4智驾公司，内部实际早已否决端到端上车方案。后来才象征性安排几人去做预研；
其他供应商也差不多：
留几个人研究，先做个demo试水。但真正的上车方案，可能连Transformer都还没搞定。
“主机厂和资本，谁会知道用了什么呢？现在不吹活不下去。” 有人为此辩解。
但如今，国内主机厂勉强施舍的PoC项目，已经连“智驾团队半年薪水”都cover不了；
而资本…资本今年都没多少人去车展。
“嗐，黑不黑盒不重要，可不可解释也不重要，还没产品化工程化的东西罢了。我们现在是迫切希望自己早期进的项目能找到接盘侠。” 一位投资人翻白眼。
并非打击端到端。
事实上，特斯拉 FSD Beta V12在美国道路上出色的表现，让很多深陷生存焦虑的智驾人燃起了最后一线希望（即便我怀疑从年初到现在，舆论是在有意为FSD进华铺路）。
这甚至也是特斯拉FSD的“最后一线希望”。
但在国内把这件事做好，实话讲，多少要靠一点工程师尚存的理想主义。只是，在车展，“端到端”第N次被没有任何意义地魔幻化了。
它的一堆新定义也走出了一条具有本土特色的道路：
“感知的‘三网合一’是端到端”；
“感知的端到端早就做到了，现在是做‘规划’的端到端”；
“前两个大错特错。必须从感知延伸出来，再把预测规划纳入一个网络”；
“全部都是胡扯。某汤说的UniAD，那是基本中的基本。谁说落地了UniAD，谁就是大骗子。只是思路正确罢了。”
……
华为乾坤智驾的PPT：就…很模糊很虚无
由于越听越怀疑，越听越不明白，我们只能去寻找“罪恶源头”——特斯拉FSD技术架构的“历史演进路径”：
2021年，特斯拉引入了一个叫做HydraNet的多任务学习算法。包括把BEV纳入在内，用一整个单一的神经网络，解决所有感知任务。
2022年是一个关键。他们在感知网络里加入了Occupancy。其最大特点，是给出了一个类似“3D地图”的世界理解方式（下图）
那么，既然它如地图般直观明了，就可以被用来作为下一步规划的“前情提要”。
所以，它才被特斯拉纳入“规划”的第一步。
但让车辆做出正确决策，仍需一部分传统算法+深度学习（神经网络）。
特斯拉软件工程师2023年CVPR讲演，针对OCC
有了上面的感知基础，才有了2023年后，字面意义上的，特斯拉开始尝试把规划中的“传统算法”替换为神经网络（是否全部替换，换了多少，无任何细节佐证）。
但是，即便“感知一个网络A，规划一个网络B”，两者互相割裂、独立训练，也不叫“端到端”。
最终，只有A与B统一目标，B的执行效果能持续反向对A的训练产生作用，形成一个大闭环，才是正解。
因此，反观车展上，国内不同企业对“端到端”的不同解释，没有对和错，更像是对应了2021~2023年特斯拉FDS不同的进化节点。
这样一算，国内技术进展，也恰好比特斯拉平均延迟了1~2年左右。
但重点从不在概念对错。
重点是，国内抄特斯拉，只抄技术，更重要的…抄不起。
非常搞笑，外媒认为特斯拉FSD在国内竞争不过本土势力。但特斯拉，却是本土企业心中的“白月光”。国外对国内还是太不了解了。
首先是数据。
2023年6月，特斯拉软件工程师在CVPR发表了一段名为《建立自动驾驶的基础模型》的演讲。其中，他特别提到了训练世界模型的数据闭环工作：
不求无上限的数据量，但求一定量级基础上的“多样性”。
“用上百万辆车去覆盖尽可能多的场景，拿回来标注并对照人类行为做训练。这在内部叫做‘免费学习’。
工程师把注意力大部分放在数据，而非模型。”
但在国内，情况非常特殊。
一方面，绝大部分智驾公司，甚至连主机厂，都没有“100亿美元买英伟达做训练”的财力。随着新能源汽车市场越来越难，企业更倾向于外包。
“我们发现，数据量达到某个点之后，就越来越没用。或者说，效果越来越不明显。”
有一线工程师反馈，“数据量越大越好”的理念与他们实际的工作感受，是相背离的。
“从100亿到1万亿之间，找出那1%的特例，变得极其不划算。”
另一方面，大多头部企业积累的数据量足够，但多样性却达不到。
特别是自研能力较强的新势力与高阶智驾Tier1，严重受限于销量，无法覆盖充足的场景。
譬如，许多2023年高调宣发的传统主机厂智驾车型，真正月销量甚至不足一百台；有些号称做完的项目，就是“OTA都没升级”的“一代没”。
所以，对于很多Tier1，现实反而是：
定点越多，企业愈发捉襟见肘，技术水平也提升不了多少。
这样便开启了恶性循环——
数据闭环（采集、标注、训练、仿真）毕竟在短期内很难出成绩，于是，在内部更加不受重视。
2024年，它成了智驾企业裁员的重灾区。
不限于一家头部智驾Tier1，目前都在默默进行数据闭环业务部门的裁撤工作。
此外，包括“仿真”在内，许多数据工具被形容为“鸡肋”一样的存在。
其次，便是硬件和算力。
在美国，不少尝试了FSD Beta v12.3的特斯拉车主，仍然是基于HW3.0的硬件配置。虽然好评很多，但不乏争议，特别是加州以外的地区。
如果特斯拉真正的“端到端”进入中国，FSD Beta v12.3必然要在3.0硬件版本的特斯拉车型上运行。
根据公开数据，HW3.0计算平台有高达144T的深度学习稠密算力，以及低于150Dmips的CPU算力。
更何况，这是特斯拉自己的神经网络加速器，对于深度耦合自研算法有着天然的优势。
NPU算力36T，一块PC上有俩，一共俩PC。
事实上，放到今天，144T（36*4）仍然是“大算力”。
近两年，智驾芯片企业愈加鸡贼，各种算力胡乱标注。一方面是为了营销和骗投资人；另一个重要原因是：避免被盯梢。
如果把深度学习加速器的IN8稠密算力，作为“坐标系”（下图），与特斯拉HW3.0齐平或更高的算力玩家，就一目了然：
用了1颗以上OrinX的大量团队（由于能力不同，OrinX释放的算力也不同）、华为的MDC610（200T），以及地平线攥干水分后的J6P（土星团队基于此做OCC和端到端）。
( 所以，这些团队最应该在FSD进华成熟后横评一下 )
可以说，参数标注最实诚的芯片公司，只有华为、TI和高通。其中，国内只有华为的实力，可以达到世界先进水平。
这么看，做端到端，还是要把硬件补一补的。
但THOR是个好选择吗？未必。只是多数企业只会用英伟达。
(错更: Orin实际100+)，可以直观明了地看到，如今大多数智驾公司，的确都在“中高算力”这个区间卷生卷死；
另外，舱驾一体，是一个还没有多少芯片企业渗透的赛道。
而高通，在智驾芯片市场具有非常独特的优势——
是单芯片做城区智驾，唯一耦合了座舱能力的企业。
此外，从CPU算力来看，华为MDC610、英伟达OrinX、高通8650以及地平线J6H/P，单芯片均超过了200DMIPS，并不是一个掣肘项。
但值得注意的是，在大算力与超大算力区间里，华为、英伟达与地平线都有自己的优秀智驾团队。
无怪乎，大疆正在与安霸洽谈合作。
至于雷军在SU7发布会上首次披露“特斯拉HW4.0将会超过720T”。首先，外网仍没有任何相关信息；其次，这个数据必然有水分。
嗯，刨开数据和算力剩下的，就是工程师团队的水平了。
$特斯拉(TSLA)$ #FSD v12#

宇多田：抄袭特斯拉，国内智驾端到端真的别吹了

作者：一把梭十年

全部讨论