宇多田:抄袭特斯拉,国内智驾端到端真的别吹了

发布于: 修改于: iPad转发:2回复:33喜欢:6

作者:宇多田

可能没人比我更盼望FSD进入中国了。如果它在中国的特斯拉上运行良好,就能把一众吹“端到端”的国内友商按在地上暴揍一顿。更何况国内车主还停留在HW3.0硬件配置,如果能打败华为高配,就已经赢了。
如果它不好,也说明不了什么,因为不讲武德的中国城区道路,也就比东南亚和南美好一些。当然,这也注定城区智驾,短期成不了大气候。
更重要的是,“硅谷神话”之所以长期不灭,是因为距离总会产生一些不必要的幻想。
如果受够了“西方把真正重要的东西藏于底层,却用虚幻又不实用的东西洗脑国内无信仰之人”的事实。
那么,这次是个重要契机。真心的,实在不行就打包卖了吧,臣服于座舱。
没有什么像“端到端”一样,能得到宣传口与一线工程师截然相反的评价。
即便两边,都心照不宣默认彼此的行为是合理的。
一家在车展铺天盖地发“端到端”广告的L4智驾公司,内部实际早已否决端到端上车方案。后来才象征性安排几人去做预研;
其他供应商也差不多:
留几个人研究,先做个demo试水。但真正的上车方案,可能连Transformer都还没搞定。
“主机厂和资本,谁会知道用了什么呢?现在不吹活不下去。” 有人为此辩解。
但如今,国内主机厂勉强施舍的PoC项目,已经连“智驾团队半年薪水”都cover不了;
而资本…资本今年都没多少人去车展。
“嗐,黑不黑盒不重要,可不可解释也不重要,还没产品化工程化的东西罢了。我们现在是迫切希望自己早期进的项目能找到接盘侠。” 一位投资人翻白眼。
并非打击端到端。
事实上,特斯拉 FSD Beta V12在美国道路上出色的表现,让很多深陷生存焦虑的智驾人燃起了最后一线希望(即便我怀疑从年初到现在,舆论是在有意为FSD进华铺路)。
这甚至也是特斯拉FSD的“最后一线希望”。
但在国内把这件事做好,实话讲,多少要靠一点工程师尚存的理想主义。只是,在车展,“端到端”第N次被没有任何意义地魔幻化了。
它的一堆新定义也走出了一条具有本土特色的道路:
“感知的‘三网合一’是端到端”;
“感知的端到端早就做到了,现在是做‘规划’的端到端”;
“前两个大错特错。必须从感知延伸出来,再把预测规划纳入一个网络”;
“全部都是胡扯。某汤说的UniAD,那是基本中的基本。谁说落地了UniAD,谁就是大骗子。只是思路正确罢了。”
……
华为乾坤智驾的PPT:就…很模糊很虚无
由于越听越怀疑,越听越不明白,我们只能去寻找“罪恶源头”——特斯拉FSD技术架构的“历史演进路径”:
2021年,特斯拉引入了一个叫做HydraNet的多任务学习算法。包括把BEV纳入在内,用一整个单一的神经网络,解决所有感知任务。
2022年是一个关键。他们在感知网络里加入了Occupancy。其最大特点,是给出了一个类似“3D地图”的世界理解方式(下图)
那么,既然它如地图般直观明了,就可以被用来作为下一步规划的“前情提要”。
所以,它才被特斯拉纳入“规划”的第一步。
但让车辆做出正确决策,仍需一部分传统算法+深度学习(神经网络)。
特斯拉软件工程师2023年CVPR讲演,针对OCC
有了上面的感知基础,才有了2023年后,字面意义上的,特斯拉开始尝试把规划中的“传统算法”替换为神经网络(是否全部替换,换了多少,无任何细节佐证)。
但是,即便“感知一个网络A,规划一个网络B”,两者互相割裂、独立训练,也不叫“端到端”。
最终,只有A与B统一目标,B的执行效果能持续反向对A的训练产生作用,形成一个大闭环,才是正解。
因此,反观车展上,国内不同企业对“端到端”的不同解释,没有对和错,更像是对应了2021~2023年特斯拉FDS不同的进化节点。
这样一算,国内技术进展,也恰好比特斯拉平均延迟了1~2年左右。
但重点从不在概念对错。
重点是,国内抄特斯拉,只抄技术,更重要的…抄不起。
非常搞笑,外媒认为特斯拉FSD在国内竞争不过本土势力。但特斯拉,却是本土企业心中的“白月光”。国外对国内还是太不了解了。
首先是数据。
2023年6月,特斯拉软件工程师在CVPR发表了一段名为《建立自动驾驶的基础模型》的演讲。其中,他特别提到了训练世界模型的数据闭环工作:
不求无上限的数据量,但求一定量级基础上的“多样性”。
“用上百万辆车去覆盖尽可能多的场景,拿回来标注并对照人类行为做训练。这在内部叫做‘免费学习’。
工程师把注意力大部分放在数据,而非模型。”
但在国内,情况非常特殊。
一方面,绝大部分智驾公司,甚至连主机厂,都没有“100亿美元买英伟达做训练”的财力。随着新能源汽车市场越来越难,企业更倾向于外包。
“我们发现,数据量达到某个点之后,就越来越没用。或者说,效果越来越不明显。”
有一线工程师反馈,“数据量越大越好”的理念与他们实际的工作感受,是相背离的。
“从100亿到1万亿之间,找出那1%的特例,变得极其不划算。”
另一方面,大多头部企业积累的数据量足够,但多样性却达不到。
特别是自研能力较强的新势力与高阶智驾Tier1,严重受限于销量,无法覆盖充足的场景。
譬如,许多2023年高调宣发的传统主机厂智驾车型,真正月销量甚至不足一百台;有些号称做完的项目,就是“OTA都没升级”的“一代没”。
所以,对于很多Tier1,现实反而是:
定点越多,企业愈发捉襟见肘,技术水平也提升不了多少。
这样便开启了恶性循环——
数据闭环(采集、标注、训练、仿真)毕竟在短期内很难出成绩,于是,在内部更加不受重视。
2024年,它成了智驾企业裁员的重灾区。
不限于一家头部智驾Tier1,目前都在默默进行数据闭环业务部门的裁撤工作。
此外,包括“仿真”在内,许多数据工具被形容为“鸡肋”一样的存在。
其次,便是硬件和算力。
在美国,不少尝试了FSD Beta v12.3的特斯拉车主,仍然是基于HW3.0的硬件配置。虽然好评很多,但不乏争议,特别是加州以外的地区。
如果特斯拉真正的“端到端”进入中国,FSD Beta v12.3必然要在3.0硬件版本的特斯拉车型上运行。
根据公开数据,HW3.0计算平台有高达144T的深度学习稠密算力,以及低于150Dmips的CPU算力。
更何况,这是特斯拉自己的神经网络加速器,对于深度耦合自研算法有着天然的优势。
NPU算力36T,一块PC上有俩,一共俩PC。
事实上,放到今天,144T(36*4)仍然是“大算力”。
近两年,智驾芯片企业愈加鸡贼,各种算力胡乱标注。一方面是为了营销和骗投资人;另一个重要原因是:避免被盯梢。
如果把深度学习加速器的IN8稠密算力,作为“坐标系”(下图),与特斯拉HW3.0齐平或更高的算力玩家,就一目了然:
用了1颗以上OrinX的大量团队(由于能力不同,OrinX释放的算力也不同)、华为的MDC610(200T),以及地平线攥干水分后的J6P(土星团队基于此做OCC和端到端)。
( 所以,这些团队最应该在FSD进华成熟后横评一下 )
可以说,参数标注最实诚的芯片公司,只有华为、TI和高通。其中,国内只有华为的实力,可以达到世界先进水平。
这么看,做端到端,还是要把硬件补一补的。
但THOR是个好选择吗?未必。只是多数企业只会用英伟达。
(错更: Orin实际100+),可以直观明了地看到,如今大多数智驾公司,的确都在“中高算力”这个区间卷生卷死;
另外,舱驾一体,是一个还没有多少芯片企业渗透的赛道。
而高通,在智驾芯片市场具有非常独特的优势——
是单芯片做城区智驾,唯一耦合了座舱能力的企业。
此外,从CPU算力来看,华为MDC610、英伟达OrinX、高通8650以及地平线J6H/P,单芯片均超过了200DMIPS,并不是一个掣肘项。
但值得注意的是,在大算力与超大算力区间里,华为、英伟达与地平线都有自己的优秀智驾团队。
无怪乎,大疆正在与安霸洽谈合作。
至于雷军在SU7发布会上首次披露“特斯拉HW4.0将会超过720T”。首先,外网仍没有任何相关信息;其次,这个数据必然有水分。
嗯,刨开数据和算力剩下的,就是工程师团队的水平了。
$特斯拉(TSLA)$ #FSD v12#

精彩讨论

bazil05-11 21:09

我翻开文章细细一看,歪歪斜斜的每行里都写着“FSD”几个字.我横竖睡不着,仔细看了半夜,才从字缝里看出字来,满本都写着四个字是“逢中必反”!

等着解套呢05-11 15:44

我觉得国内的竞品没必要关注,眼下要关注的是FSD作为行业开先河者,到底能否取得商业上的成功——订阅覆盖率—>促进销量—>友商主动来谈授权,好东西自然会产生价值,如果产生不了价值,吹破天也没用。

雨水88805-12 05:11

即使一篇事实求是的好文,哀国者们也一定会说你祟洋,跪舔。文化使然!

全部讨论

都是胡搞,买不到nv训练,终端也拿不到台积电先进产能。用手机或者显卡芯片改一下固件就想玩自动驾驶。

05-11 21:09

我翻开文章细细一看,歪歪斜斜的每行里都写着“FSD”几个字.我横竖睡不着,仔细看了半夜,才从字缝里看出字来,满本都写着四个字是“逢中必反”!

05-11 18:46

看特斯拉把国内企业按地上摩擦,你咋就那么高潮呢!你主子是小日吧

05-11 15:44

我觉得国内的竞品没必要关注,眼下要关注的是FSD作为行业开先河者,到底能否取得商业上的成功——订阅覆盖率—>促进销量—>友商主动来谈授权,好东西自然会产生价值,如果产生不了价值,吹破天也没用。

05-12 05:11

即使一篇事实求是的好文,哀国者们也一定会说你祟洋,跪舔。文化使然!

05-11 16:36

是骡子是马拉出来遛遛,我也期待FSD进来进来体验一下

05-11 23:14

根本都不懂原理就胡乱用词,鄙视你这种笨瓜。纯视觉天花板不及多传感器的脚底板。

05-12 15:23

若只文章

05-12 10:32

感觉要先学习好表达能力。