为什么马斯克说现在的瓶颈在于“验证”?

发布于: 修改于: 雪球转发:18回复:146喜欢:80

$特斯拉(TSLA)$ 的算力解决后,其实FSD的更新速度没有加快太多。小版本十天,中版本二十天,但之前也是如此。我之前曾分析,大概率因为瓶颈在于验证,而验证流程不可避免,没想到被马斯克确认了。

最开始我以为验证就是纯现实验证,后来Ashok在电话会议解惑了:先做闭环模拟验证,后做开环现实验证;闭环验证主要是对过去数年积累的“关键事件”做重放,或者可以生成视频来模拟类似情况来做验证(两者都可以加速),而开环验证包括“QA-员工-用户”三个环节需要递进式推送(现实无法加速)。

重要的是,现实验证这个部分非常重要不可省略。我们并不能用模拟来替代现实,因为完美的模拟前提条件是对现实的完美预测,可如果能完美预测现实,最终目标就实现了也就不需要模拟了。因此,我们推导出现实验证是不可省略的。事实上,如今也正式被马斯克确认成了FSD新的瓶颈。

这里有几个关键点很多人可能不知道:

1. 驾驶大多数时间都是“垃圾时间”,就是一些无聊的车道保持之类的。所以辅助驾驶门槛很低,友商谁都能做。随便弄弄,好像也能做出来一个看起来还算能用的产品。

2. 驾驶的难度上限却非常高,最复杂的情况可能人类都无法处理,只能期待传说中的AGI来解决。而这些复杂的罕见情况,分布非常稀疏,普通人可能几天都碰不到一次。

3. 在后期的训练中,只有高难度的、罕见的接管数据才有显著价值,才能够提高模型的能力上限。但随着模型越来越安全,罕见情况的出现频率也将越来越低。

4. 目前虽然FSD自己并不成熟,但“FSD+人类”的数据早就在安全性上超越人类。所以,FSD接管数据的收集效率其实并不高,当前更安全的v12.3.X某种程度上可能雪上加霜,进一步提高了收集难度。而可以预期的是,未来v12.4.X,v12.5.X等版本的收集难度还会进一步加大。

5. 这些“关键事件”的收集、训练、验证,本质上只能靠大规模车队力大砖飞。指数级的能力提升理想情况下会带来车队规模的扩大,从而导致数据量指数级提升,并显著提高“新接管”出现的频率。持续出现的“新接管”数据,才能持续的将FSD的能力带到新的层次。

基于以上5点,因为收集罕见情况的难度太高,我推测解决“验证瓶颈”的成本也过分的高。短期内我们可能很难看见这个问题从根本上解决:只能随着能力一次次的增强,车队也跟着一次次的扩容,从而弥补变得更低的收集效率。

然而,在我看来,这种“高难度”恰恰是FSD、未来的无人车,以及所有现实世界AI产品最重要、最本质的护城河:完美的FSD,可能需要全人类大部分人都加入车队才能实现。 一旦训练出来,人类社会大概率不会想要训练第二个,那将是巨大的资源浪费。即使出于“战略角度”想要训练第二个,难度将比第一个高出数倍。因为用户一旦有了便宜好用的完美FSD,就不会有那么多的耐心陪跑创业公司。他们不会愿意花钱、牺牲安全性来买一个半成品,更不会愿意免费帮企业测试、验证、提升他们的产品。

精彩讨论

Raines雷05-08 08:09

你的观点基于一个隐含的假设:FSD的发展应该在商业价值上体现出线性、连续、等比例的正面影响。我举个例子来解释为什么这种假设站不住脚:如果说100%完成度的FSD可以让销量翻10倍,那么30%完成度的FSD难道就一定可以让销量翻3倍?这种逻辑显然不合理。
对于大多数人来说,他们不在乎FSD是100公里无接管,还是1000公里无接管。他们只在乎一个问题:“我要不要接管?” 事实上,技术在稳步发展时,大多数时候都不会以相同的比例让财务上的数据也稳步发展。然而,技术本身的发展往往可以体现出明显的趋势,你可以预期到转折点在哪里?什么时候到来?基于对技术的深度理解,来合理预期这些转折点,才是投资科技企业的关键能力。
如果以“财务至上”的传统投资原则来分析前沿技术,就一定会犯根本性错误。这个道理很简单:如果你知道爱迪生实验失败1000次后就会成功改进电灯,你会希望在实验失败500次左右的时候就投资他。我认为FSD对基本面的影响是二分的:在实现无监督FSD之前对财报基本上没有影响,在实现无监督FSD之后会直接成为主要收入驱动力。两者天壤之别,但是转变可以在一夜之间完成,快到任何人都反应不过来。
很多人闭上眼睛不愿意看见这一点,认为财务至上,其它一切都是在“讲故事”。在他们的眼中,一切技术就是“黑盒”,就像抽奖一样,研发要么遥遥无期,要么突然出现进展。如果不明白我说的这些,我的建议是不要投资特斯拉。

仓又加错-刘成岗05-08 11:58

我的个人看法:如果按照现在自动驾驶的技术路径发展,通用机器人是不可能出现的。限定场景的机器人,有可能。
首先,机器人和开车这种限定场景不一样,可能对corner case是零容忍的,即使容忍,也会比自动驾驶要求更高,毕竟谁也不允许存在厨师机器人把自家小朋友切了的一丝可能性存在,对吧?
其次,机器人比开车这种限定场景,corner case多太多了,可能多上万个数量级?
原文和我上一个回帖都说了,corner case逼近的代价可能是指数级提高的。
指数级*上万个数量级*指数级,三个相乘,是什么概念?工程量有多大?想都不敢想。开句玩笑话,可能训练这样的机器人模型,全世界的电都不够它用。

仓又加错-刘成岗05-08 09:16

这么说来,自动驾驶的规模效应比我想象中的更要显著。

仓又加错-刘成岗05-08 11:50

不是微妙的提升。如果我们用一个数据来衡量自动驾驶的安全性,那就是每百万公里事故率,越小越好,比如不专门收集corner case,可能事故是10000起,提升到1000起,提升到100起,提升到10起。这个效果用户感知是非常显著的,领先的厂商一定会出来主导定义这个安全等级标准,比如说(都是L4下还分)S1、S2。。。S5,这种案例过去的商业史上太多了,厂商都会这些招数。
我说的规模效应比我设想的更显著,指的是这个提升过程,成本可能是指数级提高的,用户规模小的主机厂可能在它的续存期内永远都无法达到下一个安全级别。

Doloresy05-08 12:17

保姆还有纵火的呢,这样的corner case也不妨碍她们继续进入家庭吧。
100%覆盖corner case的技术是不存在的啊 世界就是无穷可能的。人类自己有很多“坏人”或者失误/失能可能存在 (虐待,失手,故意把儿童抛下楼)要求机器却是另一种要求。

全部讨论

这么说来,自动驾驶的规模效应比我想象中的更要显著。

最近让我最费解的不是FSD理论推导到底有多牛逼(我个人虽然没有开过但主观上感觉它的确不错),而是想了解一个事实:四月底五月初,北美特斯拉销量到底有没有提振?如果有,则证明FSD会兑现商业化业绩,如果没有那么说明FSD对卖车帮助不大(跟我认知不符)。这对我来说,是一个大事大非的关键信息。$特斯拉(TSLA)$

网页链接 关于这个瓶颈,可以看这篇文章,任何关心自动驾驶何日实现的人都应该看看。

非常同意你最后的结论。用一句老话来形容就是:前途是光明的,道路是曲折的… 言归正传,你拍个大腿,按照这个思路,大版本的更新会比原来的预计慢多少?比如说12.4和12.5?另外,比如中国区(新区域)的开发,会不会有助于验证的加速?

你说的非常有道理。也可以换句话来讲:投资特斯拉是一个信仰。因为无法证伪。

还不一定,比如华为智驾只卖2000块,性能是特斯拉的1%,特斯拉1000公里接管一切,华为一百公里接管一次。一百公里接管一次也很轻松呀

05-08 09:31

考60分和考满分的区别。考60分不难,大多数人都能做到,但是考满分非常难,难度可能是考60分的成百上千倍,而且最终能做到的也是极少数。那你要问那么考95分行吗?要么98分行吗?我觉得这就是问题所在,在自动驾驶领域,98分行吗?99分行吗?

我怎么觉得特斯拉的无人驾驶或许思维方向错了:或许应该反过来用太阳能无人“车”在公路上自动驾驶

05-08 08:43

非常赞同

05-08 11:20

这篇文章三年后再看,当下的价值可能被严重低估。