发布于: 修改于: 雪球转发:0回复:22喜欢:2

$比亚迪(SZ002594)$ $特斯拉(TSLA)$ $长城汽车(SH601633)$ 特斯拉在无人驾驶上又遥遥领先,华为的端到端方案呢?国内元戎似乎已经跑到了前头。

《晚点 Auto》独家获悉,长城汽车引入元戎启行做为第二家智能驾驶供应商,元戎将为长城提供端到端的智能驾驶方案,今年计划落地三款车。


全部讨论

华为余大嘴发话了,说$特斯拉(TSLA)$ fsd比不上智界s7上的智驾系统,他派人专门到美国做了体验得到的结论。网页链接 财经杂志: #余承东派人出国体验特斯拉FSD :"智界S7的智驾仍是全世界最好的"

05-06 12:06

华为的ADS3.0属于两段式,已经上路的商汤绝影UniAD、特斯拉FSD确认是一段的真正的端到端:$比亚迪(SZ002594)$ $特斯拉(TSLA)$ $赛力斯(SH601127)$
目前,市面上不少端到端方案是在感知和决策两个模块分别搭建一个大模型框架,更容易实现落地,但“两段式”端到端方案的感知和决策两个模型之间传输的信息是人为定义的显性信息,数据传递仍然会有过滤和丢失。
商汤绝影UniAD方案则是业界首个将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型,实现感知决策一体化,不需要对感知数据进行抽象和逐级传递,“所见即所得”,将原始信息直接输入到端到端模型中,然后以自车轨迹规划为准进行指令输出,实现真·端到端自动驾驶。
首先,传统智驾方案和“两段式”端到端方案都是依靠人为定义的规则在传递显性信息,存在信息误差和丢失,难以完整准确还原外部场景,而端到端自动驾驶大模型最明显的优势就在于信息的无损传递,端到端模型基于原始信息进行学习、思考和推理,最终能像人一样综合理解复杂的交通环境,并且能够不断成长,有着更高的能力上限。
其次,依赖数据驱动的端到端方案能够将其学到的驾驶能力和技巧迁移泛化到其他场景当中,具备更快的迭代效率,帮助车企更快速实现全国都能开的目标,无论是城区还是乡村道路,现在的UniAD都行驶得游刃有余。
最后,端到端自动驾驶大模型是像人一样感知和理解外部环境,纯视觉和无高精地图就是UniAD与生俱来的天赋,它只需要导航信息就可以把车驾驶到目的地,天然就能帮助车企降低软硬件成本。
商汤绝影在北京车展发布了更聪明更强大的下一代自动驾驶技术——DriveAGI的前瞻预览,它是基于多模态大模型对端到端智驾方案进行改进和升级。
DriveAGI是自动驾驶大模型从数据驱动向认知驱动进化,超越司机的概念,加深其对于世界的理解能力,具备更强的推理能力、决策能力以及交互能力,是目前自动驾驶中最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案,向着完全无人驾驶迈出重要一步。
不仅如此,DriveAGI是基于多模态大模型打造,具有强大的交互能力,让用户能用在座舱内进行自然语言指令的交互和驾驶控制,在体验上进一步做到可感知、可交互、可信赖。

05-06 12:15

一文让你搞清楚国内的“端到端”乱想,看看究竟谁在adas上使用真正的端到端模型:$比亚迪(SZ002594)$ $特斯拉(TSLA)$ $赛力斯(SH601127)$
1. 国内智驾行业为何在2024年集体喊出了端到端?
一个直观的回答是,因为特斯拉这么干了。去年年初,马斯克在推特上透露特斯拉已经开启端到端自动驾驶方案的开发。8月,马斯克首次直播亲测FSD V12,系统呈现出的类人驾驶效果引发热议:自动驾驶看起来真有希望了(尽管中途接管了一次)。
FSD V12的类人操作:前方车道已经拥堵,那就不要开过去堵住路口
但更接近现实情况的答案是,端到端是诸多企业在进行过大量实践、试错后,逐渐认同的一种方法。或者说,如果智能驾驶的技术问题主要是一个AI问题,那么端到端是一个通用解。
端到端并不是一个全新的概念。在人工智能领域,它是一种普遍使用的方法。比如在各种AI翻译、语音转文字应用中,基本都使用端到端:原始数据被送进一张神经网络中,经过一系列运算后,直接给出最终结果。
在智能驾驶领域,行业对端到端的探索也不鲜见,比如英伟达、Waymo都组建过团队进行预研,美国的初创公司如Comma.ai和Drive.ai,则选择All in端到端。但早年间算力、算法性能尚低,基于此开发的神经网络规模与能力有限,自动驾驶的任务又高度复杂,端到端方案的表现并不好。
因此,在实际量产中,行业前些年更普遍的做法是分而治之:
将智能驾驶的技术栈切成多个模块,每个模块有独立的算法(有的模块如感知多使用神经网络,有的模块使用传统算法),众模块前后接力,协作完成智能驾驶任务。直到目前,市面上大多L2及其以下的智能驾驶仍然使用这套技术栈,并且运行得不错,因为任务相对简单。
但问题在于,当企业的目标是实现高阶智驾乃至自动驾驶时,这种模块化的方法就不够用了——一个关键原因是,“中间人”太多了。
几乎所有地球人都参与过的“传话游戏”中,一个必然会发生的情况是,当参与游戏的传话人越多,最后一个人说出的结果与最初传下去的话差别就越离谱。
就像这样
这与智能驾驶模块化技术栈的问题共通:当信息流转的层级越多、传递的链路越长,失真情况就越严重。人类会发挥主观能动性胡乱脑补,而智驾各模块不仅对信息有损压缩、传递并累计误差,还会面临并行模块信息相互打架的问题。
面对人员冗杂、难以配合、效率低下的问题,一家企业惯常的操作是精简组织,付4.5倍工资招3个能力强的干6个人的活。
同样的事情也发生在智驾技术栈中。车企与智驾公司们不断整合智驾技术栈原来相对细碎的模块,打包成感知预测、决策规划、控制执行三大模块(也有企业将预测拆出构成四大模块)。
然而,做到这一步实际上只是让高阶智驾能用,难题依然层出不穷。
在大多已上市的智驾车型的决策规划模块中,有大量人类工程师手写的if else规则去应对不同场景。在不复杂的场景下,这些规则能运行得不错,但当场景高度复杂比如在城区智驾时,靠if else很难精确地描述并处理场景,规则与规则之间也会冲突。
就像一个刚拿证不久,反应总是会慢半拍的新手,常常会在心中默念交规开车,在车流较少时还能应付,遇到早晚高峰就原形毕露。不少智驾车型的鲁莽、笨拙、机械感,和这有分不开的关系。
为了解决这个问题,国内智驾系统开发进度靠前的企业都在进行一项工作:在决策规划模块中,逐渐用神经网络替换掉手写规则,靠数据驱动解决人工无法穷尽的弊端。
比如华为在北京车展期间发布的ADS 3.0,将原本有不少手写规则的预测决策规划模块替换为了一整张PDP神经网络;小鹏即将在五月推送的天玑系统,也会在相应模块引入神经网络模型Xplanner。
但做到这一步依然不够好。因为感知神经网络与决策规划神经网络的仍然相对独立,且任务并不相同,两者之间依然存在人工设计的通信接口,有一个信息筛选过程,也自然意味着存在信息的有损压缩——好比一个乘客负责看路,来指挥蒙着眼的司机如何开车。
在理论上,取消所有“中间人”,让一张庞大的神经网络负责整个驾驶任务,才是充分利用信息的最优解,这就是端到端智能驾驶。
智驾技术栈的演进方向
而眼下,智驾行业正处于激烈的城市NOA开城竞赛中。以人类为模板,智驾系统如果要做到全国都能开,驾驶感类人、丝滑,需要的当然不是几个人协作,而是单个足够强大的大脑在正确理解环境后,指挥腿脚做出正确的动作。
端到端就是打造出这颗AI大脑的关键路径。这是智驾行业今年对它前赴后继的根本原因。
2. 到底哪端到哪端
略显喜感的是,在这场端到端的热潮中,要么是因为中文博大精深,要么是一些企业有意为之,尽管不同企业异口同声地在说端到端,他们表达的可能完全不是一个意思。
比如华为在非智驾领域讲端到端时,表达的是“从客户端来,到客户端去”的流程。
当某些智驾算法供应商在讲感知端到端时,表示的意思其实是“将感知模块原本数张负责不同任务的神经网络整合成了一张”,而不是完全实现了端到端智能驾驶。
某些车企在宣传端到端时,实际所做的工作是“把智驾技术栈的模块合并了一些”。
实际上,严格意义上的端到端自动驾驶,指的是传感器数据进入神经网络处理后,直接输出方向盘、油门、刹车等执行器的控制信号。
严格意义上的端到端智驾
不过,稍微宽泛一点的定义目前也受到认可:车辆的控制模块不需要改造成神经网络,只要一张神经网络接管感知与决策规划,能输出正确的行驶轨迹,也可以被叫做端到端。图森未来CTO王乃岩日前就发文呼吁,业界要避免陷入狭义端到端的误区,因为这对智驾量产不利。
宽泛意义上的端到端
元戎启行CEO周光持有类似的观点,他对此的解释是:
相对于感知和决策规划,汽车的控制自由度较低,难度不高,传统算法经过长期发展已经有非常成熟的解决方案。在传统算法可以精确控制车辆按轨迹行驶的情况下,将其改造为神经网络并无明显收益,反而可能带来不同车辆的适配问题。
在这两种狭义与广义的端到端之外,一些企业试图将端到端定义为“把感知模块与决策规划模块,改造成感知神经网络和决策规划神经网络”。
宣称自己是端到端(其实不是)
相比传统的模块化架构,用两张神经网络解决智驾的思路的确更先进,能更好地实现数据驱动。但正如上文所说,两张神经网络之间仍有人工设计数据结构的接口,这个中间人的存在必然伴随信息损失,与端到端“充分利用信息”的思路有差距。
由两张大神经网络驱动的智驾,只能说是在感知与决策规划环节各自完成了端到端,能在这两个环节各自获得局部最优解,但智驾需要的是全局最优解。
在此之外,还有各种各样的端到端则有些像车企的自研榜单,只要定语加得多,哪款车都可以是最畅销车型;同样只要定义的范围足够小,任何企业都能掌握某种端到端。
类似的重新定义其实在智驾的无(高精地)图竞赛中已经广泛上演过,不少公司宣称自己的方案是无图,但实际上纷纷在导航地图上打补丁、堆先验、定制图层,更像是一种变相的高精地图。
而真正的“无图”,应该是仅采用导航电子地图(不用地图不可能),业界传闻只有极少数供应商能真正提供无图智驾方案。
不同企业此前对无图,如今对端到端千差万别的理解和运用的区别,反映出他们截然不同的出发点与目的地。

04-29 22:27

国内越来越多的厂商也跟上端到端技术了:$小鹏汽车(XPEV)$ $商汤-W(00020)$ $特斯拉(TSLA)$
北京车展上除了小鹏宣布落地规控的端到端以外,还有一家供应商的端到端方案也在车展上亮相了,就是商汤科技的UniAD((Unified Autonomous Driving)。
#2024地平线智驾科技产品发布会#上,高阶智能驾驶解决方案#地平线SuperDrive正式发布#!SuperDrive的感知端到端架构整合了动态、静态和Occupancy三网,有效还原了客观物理世界,在发布会上余凯介绍到,“SuperDriver提高了遮挡准召率70%,同时减少了动态代码行数90%和网络负载50%,解决了行业感知架构中存在的时延高、规则多和负载重的问题。数据驱动的交互博弈使其能够在拥堵场景下提高变道成功率50%和路口通过率67%”,我们也真实的在#老司机首秀#的展示中看到了城区困难路况中,汽车在SuperDrive的指导中,安全轻松顺利的通过了考验。
第一步让动态、静态、occupancy三网合一,实现感知的端到端,第二步引入基于数据驱动的交互,再与感知融合,形成一个大的端到端。
好处显而易见,遮挡准召率提升70%,动态代码行数降低90%,网络负载降低50%; 复杂交通流拥堵场景下变道成功率提升50%,路口通过率提升67%。

05-02 19:24

英伟达全球副总裁、汽车事业部负责人吴新宙谈端到端,看起来有些厂商号称端到端的是否真的是端到端存疑,可能是rule-based和data-based共存一段时间:$英伟达(NVDA)$ $比亚迪(SZ002594)$ $特斯拉(TSLA)$
针对端到端的问题,吴新宙认为端到端是自动驾驶的最终一步,未来一定会到来。但是对于端到端的理解不能仅仅停留在字面上,端到端也需要一些其他的技术作为配合。
他认为,能够把端到端模型做好的企业也一定有很好的第二代甚至第一代的自动驾驶堆栈。举个例子,端到端模型像是未来要成为博世甚至博士后的学生,但是成长的过程中也需要小学老师、初中老师去教育,最终变得强大。
接下来几年,自动驾驶行业可能会出现一个新的趋势,端到端模型和原有的模型相辅相成,在一些复杂的路口可以处理的更加拟人化,而原来的模型和方法则可以在安全性上发挥作用。
至于端到端黑盒化的问题,吴新宙也给出了自己的看法,他认为,结合上面讲的第一代第二代算法栈,可以保证端到端的安全性,通过双方差异的地方,也可以持续判断端到端模型的合理性。
另外,端到端大模型有周边的输出点可以观测,相当于在黑盒上开几个窗,可以看到信号是怎样的模式,这些输出点不参与运行,但是可以做观测。
关于英伟达在智能驾驶方面的规划,吴新宙表示,目前主要是按照三步走的规划,第一步是希望软件在现有的L2/L2+市场保持第一梯队;第二步是希望在L2++领域完全做到行业领先,支持端到端。
第三步则是希望在2026年量产L3,完全把人从系统中拿掉。英伟达的目标是让用户可以在车里玩手机,对于用户来说,开车不是刚需,从A点到B点是刚需,玩手机也是刚需。

04-22 15:22

北京商报讯(记者魏蔚)4月22日,北京商报记者获悉,智行者与清华大学车辆学院研究团队,完成了国内首套全栈式端到端自动驾驶系统的开放道路测试。该团队研发的端到端自动驾驶系统涵盖了“感知-预测-决策-规划-控制”等全链路环节,从1月率先启动了城市工况的开放道路验证,经过近4个月的内部测试,完成了各项性能的综合评估。系统开发中,智行者主要贡献在于感知模型的构建与预训练,并与清华大学等单位共同完成了实车平台的搭建与开放道路测试。
北京智行者科技股份有限公司(简称智行者)成立于2015年,聚焦自动驾驶汽车大脑的研发,致力于成为通用场景L4解决方案提供商。公司已有员工近 500人,核心团队均来自清华大学汽车系,技术优势显著。公司已申请专利近 1000余件,并成功入选北京市及国家级专精特新小巨人企业。公司已获得厚安(厚朴/Arm)、百度、顺为、京东等多家知名机构的投资。
智行者的技术能力及产品能力均处于行业头部地位,完整打造了以软件、硬件、数据为核心的铁人三项,自主研发的自动驾驶大脑已成功赋能智能出行、智慧生活、特种应用等多个领域,逐步实现用自动驾驶大脑构建智慧生活的企业愿景,已实现自动驾驶车辆的批量化落地,商业化能力位于国内自动驾驶企业前列。

05-06 12:20

无人驾驶(智能驾驶)的难点不是驾驶,而是出意外之后的冗余措施或补救措施。光驾驶大家都能做到基本无差距。比如打滑了,爆胎了,极端情况掉水里了,智能驾驶如何施救让车辆安全停下来。这些才是智能驾驶的杀手锏,管杀不管埋是不合格的。

05-06 12:57

全自动驾驶,真正的,商汤UNiAD和特斯拉FSD