讨论详情 - 雪球

马斯克对于自动驾驶一直坚持纯视觉路线，他的观点是：当雷达路线和视觉路线出现分歧时，你相信哪一个？视觉的精确度要高得多，所以与其进行传感器融合，不如加倍使用视觉，传感器是一种比特流，相机的比特流比雷达（或激光雷达）高出几个数量级。
雷达必须显著提高比特流的信噪比，才值得进行复杂的集成。
随着视觉处理技术的进步，雷达将被远远甩在后面就在这几天TikTok团队联合香港大学，浙江大学发表了论文《深度无所不能》证明了马斯克说得没错：视觉就是一切

热门回复

过河小马--henry李

01-29 01:07

查看讨论

他哪怕有一亿工程师都没用，冲突就是冲突，懂什么叫矛盾吗。别把华为当神。几年前华为还在吹什么5G+高精地图的蹩脚方案，现在全行业都不用了。

过河小马--henry李

01-29 01:05

查看讨论

你这个问题，我一样可以还给你，遇到下大雨了，激光雷达废了，你老婆就别生了，真是没脑子，人怎么开车的，视觉就会怎么开车，人会怎么解决，视觉就怎么解决

九十二公里

01-29 01:25

查看讨论

我还是再提醒您一下，现在的很多机器包括军舰这类在内都是使用多重感受系统叠加在一起的，那为什么他不会担心产生冲突呢？您可以去问一问那些这个领域的，也别说专家了，就问问军迷也行，或者能找到专家问问专家为什么军舰不怕多重感受之间造成冲突。很简单。不是没有冲突，是因为它可以通过算法来决定优先顺序以及权重，最后做出决策，不同的感受系统如果信号出现冲突，出现冲突就出现冲突，最终还是可以做出决策，而这个决策大概率还是正确率比较高的，这就可以了。信号冲突，没什么大不了的。已经成熟的很多系统都是这样的，所以你只要去稍微了解一下这些领域，唉，他们怎么能做到的，他们是不是真的能做到，如果其他的东西能做到，那车也能做到。当然商业化的部分大家要去考虑到这么做它的利弊得失，包括成本之类的，所以我前面也说了，特斯拉不采用是因为他为了省钱特斯拉现在拥有这个领域最高的毛利率，他当然不希望多投钱啦，那那可以理解的嘛，是不是就是任何事情要考虑到性价比利弊得失的，所以商业化应用，那有的人选择纯视觉的，有的人选择叠加的，那这是大家的选择不一样，但是我只是跟您讲采用多重叠加的方式不是不能用，因为在其他很多领域已经这么干了，没问题。
您可以去查一查其他领域的一些信息，你比如说问一下战斗机是不是多重的感知系统对不对比如说雷达比如说态势感知，然后就是飞机也有纯视觉的感知系统不是人眼看啊，飞机上也有类似于摄像头的纯视觉的感知系统，那它和雷达之间怎么进行整合答案是可以做到没问题，所以你去了解一下其他领域的事情，如果其他的机器能做到，那车也是一个机器车也能做到，对不对？这个是最简单的古希腊三段论。飞机是机器，轮船是机器车也是机器，那如果飞机这种机器能做到船。那是不是就证明机器是能做到这件事的，那车也属于机器，所以车眼应该能做到，至少有能做到的潜力是很简单的一个三段论，2500年前古希腊人搞出来的最简单的一个逻辑推理。
那至于战斗机或者是军舰，是不是真的能够很好地使用多重感知呢？您别听我的对吧？你不用相信我说的话，你自己去查一查去问一问。
如果那些机器能做到车，理论上也能做到。

九十二公里

01-29 01:14

查看讨论

没有什么冲突算法，会自动整合的没有冲突知道吗？遇到冲突人家会算法，然后做出最佳抉择，这个最佳抉择注意不是100%正确，但是绝对比人靠谱的多。当机器足够成熟到适合在路上用的时候，他的失误率绝对比人低得多会非常可靠，但是没有100%的机器也会出错。但是出错就出错呗，出错也照样可以用的，就像飞机一样，飞机大型客机每100万飞行小时出现一次致命事故，那又怎样？大家不还是坐飞机吗？没有事情是100%的，只要足够安全就可以了，事故率足够低就可以了。

九十二公里

01-29 01:09

查看讨论

别，我以为了在这方面您没有常识好吧，军舰都是采用不同的雷达的，不同的感受模式，这是最最基本的一些常识了，唉，不想跟您辩论这方面的东西啊，做不好的情况，下单一的也好多重的也好都完蛋，但是做得好的情况下多重肯定是有优势的，这是最基本的常识，为什么你有5种感觉，为什么你不只剩下一种，如果你觉得你说的对，请你放弃4种感官只剩下一种，你随便选一种吧。

九十二公里

01-29 01:03

查看讨论

都是一些非常非常简单的道理，特斯拉为什么纯视觉方案省钱呀？多简单的道理就是省钱毫米波雷达那不贵吗？多配备一套系统的不贵吗？统合不同，感觉这多简单的事情啊，对不对？你你都能做到，那怎么自动驾驶就做不到呢？是不是你把自动驾驶把人家的算法想的太弱智了，那是人工智能，不是人工弱弱能对不对？那自然称得上人工智能，就是说明它是有点智慧的，它是能做出综合的判断的，这些事情不需要操心，这是最基本的事情，如果做不到这产品就不合格，同样的自动刹车早就有很多年前就有，可是有的车厂做的好，有的车厂做的就差。测试当中不同的场景当中，有的车就能刹停，有的车就撞上了，明白吗？同样的。比如说一套系统啊，有雷达又有视觉方案，他做得好就可以，非常优秀，做不好就会撞上，重点是你能不能做好啊朋友对不对？同样的你纯视觉方案你做不好，你不也一样不好用吗？是不是那怎么人家有两套方案综合在一起了，你就认为他一定做不好呢？那是不是你觉得你所有的感官就只剩下视觉或者只剩下听觉你就更优秀了，你放弃其他4种感官，你嗅觉也不要了，触觉也不要了，你这个人的感知就更优秀了，因为不会受到其他感觉的干扰了，这是不是很荒谬啊？你可以非常优秀的统合你的五感，那怎么车就不能啊？车就只能用纯视觉增加一种它就傻掉了，不至于吧？算法是干嘛的。

九十二公里

01-29 01:00

查看讨论

如果人开车是最优秀的选择，请问为什么要搞自动驾驶？如果人开飞机是最优秀的选择，请问为什么？飞机90%的时间客机都是采用自动驾驶的，对不对？这是多么简单的常识啊。你有5种感觉，你嗅觉闻到的味道和你视觉有冲突了怎么办？有没有这种情况当然有，你怎么决定？当然是混合计算啦，对不对？你有优先顺位的排序吗？多么简单的事情啊，你自己都能决定，那怎么人工智能就不如你的直觉吗？对不对？算法会解决这个问题的多简单的事情啊，导弹的导引头都不只是一种导引方法，明白吗？那怎么导弹就迷糊了就打不中目标啦？

九十二公里

01-28 12:18

查看讨论

遇到突然起大雾甚至洞雾的天气，用雷达的车就活了，纯视觉的车就挂了。
我们不太了解的人，一直都以为他是为了省钱，因为激光雷达也挺贵的。

九十二公里

01-29 02:14

查看讨论

还补充一下啊，现在的技术就是民用级别的技术，比如说ai换脸都可以做到，如果这个活做得好的话，真的几乎以假乱真的，包括场景替换对吧，你把你整个背景都替换掉了，你这个城市的背景可以换成一个大自然的背景，都做得非常的逼真的，那个简单的过滤一些杂波呢，太简单的事情了。就是做的优秀的ai换脸的那些视频，那真的是以假乱真的，现在的技术可以做到这个程度了。所以要对技术有信心啊，过了一点杂波那是小事情，更复杂的应该也没问题。将来甚至旁边的司机给你打个手势，你都应该知道是什么意思，也就是说车子都能够知道旁边那个司机打个手势，他大概是什么意思，未来可能连这个都能做到，现在的可能是做不到。
还是要对技术有点信心。那个朋友的看法就是觉得除了特斯拉其他的智能驾驶车的水平，就好像磁带随身听那个水平。为什么这么讲呢？因为其实我们都知道那个随身听时代，它都是有降噪音的功能的，降噪音它就是能探测到，不管是磁带还是其他的，那些媒介里面如果有噪音，它能把它识别出来，然后把这个噪音压制，就连磁带随身听时代都有这种功能。包括现在常用的，我们通常用的蓝牙耳机，它都是有智能降噪功能，而且现在降噪功能已经做得相当不错了，有些时候为了我们的安全，特定频率还给你保留一点。耳机这些东西都谈不上什么智能的。我就是很好奇，我给他解释了好久，他就是无法接受这个事情就挺有趣，但是以前也常见，但是我是不能理解，为什么这么简单的事就说不明白呢？连鱼都有不止一种感官是吧，而且我们地球动物，你比如说犀牛犀牛的视力很差，它主要靠嗅觉，但是它在大草原上生活的也没问题啊，它靠听觉它靠嗅觉，它靠的是不是单一的感官，他也是多重感官，但是他的用的感官和我们人用的感官不一样，因为我们人主要用视觉而犀牛主要用嗅觉和听觉，但是大家都可以很好的生活呀，没有问题呀。我是又举野生动物，又举什么飞机导弹军舰。古希腊都扯出来了，但是最后还是没办法，我其实是比较好奇为什么人们可以刚愎自用到这个程度呢，这其实跟教育程度是没关系的，他就是有些人他就是会比较固执，所以我说这里面可能有一种类似于宗教的情怀，就是他认准了一件事，他觉得特斯拉能行，你们其他就不行。然后这时候他的这个呃mind是比较关闭的一个状态，所以我我感觉大概是这样，因为我以前就是也是曾经比较刚愎自用的那种感觉自己知道的东西特别少的时候，然后我就是反而听不进别人的观点，后来书看多一点之后，这想法就不一样了。所以我我跟他讨论的比较多，其实我也在好奇我究竟能不能让他理解这个，后来我发现好像还真的做不到，其实就是人的一种执念。因为按说这件事没有什么认知门槛的。就是很简单的一个常识心平气和的，稍微想一下就想明白了，都是机器，那怎么飞机船都能做到，车就做不到呢，车肯定能做到，是吧，其他的例子也都举了，就是没有任何的认知难度，但是人家就是不接受，所以其实我更好奇的是这部分。那一个是这个这件事情本身有趣，另外一个是嗯，其实在商业社会，包括呃这个顾客有些时候选择产品它就是有一种执念，有些时候实际，你比如说，呃全国各地的不同品牌的香烟之间的口味差异没很大，但是很多人他就对某个品牌很执着。所以其实人的执念在人类社会当中，也包括商品经济当中，他这个占了很大的一个重要性，这就是所谓的占据心智，建立品牌你看特斯拉就挺厉害，很多人认为，唉，就特斯拉能做到别人你就做不到，是吧，这就很厉害。这就是建立品牌呀，占据心智啊，其实是一种弱化的，类似于宗教信仰的东西，他没达到那么强，但是有那种色彩。这个对商业的影响其实挺大的，你看前几年丰田本田，尤其是丰田那个车要加价才能买，说那就是大家的一种执念。真的好到需要加那么多钱买吗？所以这些非理性的因素，其实在社会生活当中真的还是扮演了一个挺重要的角色。所以慢慢的我的注意力转移到这个话题上来了，因为这个话题其实对商业对投资也是有挺大影响的，尤其是这些to c的就是直接卖给消费者的产品，包括汽车在内都是to c的to c的产品对这方面就比较敏感。因为普通消费者他没那么理性to b的话会稍微好一点，但其实也有，包括to b也是有这种情况不是没有，但是能稍微强一点。

九十二公里

01-29 02:04

查看讨论

那个朋友就是一方面没有意识到，其实很多事情可以整合的，而不是一定是2选1，对吧，就是好像我们面对一个岔路口只有两条路或者是三条路，你一定要选择其中一条必须放弃，另外两条其实不是这样刚性的一个东西，而是在每一个刹那算法自动的来作出选择。他我们简单的说就是有个优先顺位，当然这么说是非常苍白啊，非常简化了，就是一个priority对吧，任何一个时候你你比如当下你需要做5件事情，你有5件事情需要干，那你当下只能干其中一件事的话。那你肯定要做出一个选择的，这是优先顺位。大概叫运筹学是吧，不是说我们脑子里面知道要办5件事，然后当下我们只能做一件事，然后我们就傻了定在那里了，这个这个这种可能性也存在，那就说明我们脑子有问题了，如果机器这样的话，那就说明这机器故障了啊，有些时候机器做的是不太好，比如说一些自动刹车的车子在实际测试当中经常会出现顶上去的情况，他没有办法真的刹住，那只能说他做的不够好，并不能说自动刹车这件事不好，而是说他没做好。
或者善良的就是说把它的性能就这样，它只能在特定的环境下，比如说几十公里以下应付某些情况，他能刹住你来个鬼探头，速度快一点他就刹不住了，那其实还是说明他做的不够好吧，只能这么讲了，当然这些功能它其实也是有一个极限的，也就是说这些功能是有限性的，如果你速度特别快的话，比如说你开个200公里，那可能真的刹不住，嗯，但是你你去看短视频的话都是有这种测试的啊，那有些车表现的就比其他的款式优秀很多，反过来也有一些车特别的拉胯，这都不用讲智能车啊，就就是以前的那些老燃油车也是这样子。很多老燃油车就有自动刹车系统的，只不过有的表现优秀，有的表现拉胯。
所以有些时候呢，我呢，不太懂理工科的一些术语名词啊，我听他们经常说线性外推什么的，我也不知道这词儿究竟啥意思，但是我拍着脑袋和和拍拍自己的屁屁，我瞎想可能是那位朋友，就是用了线性外推，虽然我不知道这词是不是这个意思啊，但我感觉差不多，就是他用过往的经验认为把这个事情搞复杂了，把这个事情搞冲突了，就一定是容易弊大于利，这这是一种朴素的想法，从这个想法的出发点来讲也有一点道理，但是事情是现在的技术已经达到了，可以把这些不同的感觉啊感受进行统合进行算法优化处理，作出决策，让最终结果利大于弊。已经可以实现了啊，就像几千年前人们不相信人能飞起来一样啊，在当年大家这么想，其实是可以理解的，但是现在人可以通过一些手段飞起来了。就像前面我提到的那个呃净化心理学是一样的，就是在一些呃模拟生存竞争的这么一个，呃类似于沙盒游戏里面，最后大家发现这个得分最高的生存游戏的算法呢，它是最简洁的算法，那些更复杂的算法相对来说得分都更低也就是输掉了，所以其实并不是说一定你的代码，你的规则要很长不一定的，而是说你的这个规则要足够的优秀，足够的优秀之后，他后面自己演化出去可以不断的升级迭代，他就会自我演进，就像生命体一样。但是这一开始的一些出发点，一些规定性的东西，可能会有深远的一个影响。但这里面最有启发的一点就是不是代码越长越牛。阿尔法狗的例子已经告诉我们阿尔法狗啊，那个22代的阿尔法狗它是二代吧，应没记错，应该是就是那个特别牛的那一代，它的那个指令集很短的很简洁的，他后面完全是自己从零开始推演出来的，最后打败了前代的这个阿尔法狗前代的代码是更长的，所以就是这个时代已经不是说简单的堆量的问题了。就好像蒙古骑兵是吧，呃，十万二十万蒙古骑兵，那在这个冷兵器时代无敌的，结果突然你拿出来1130禁防炮，对吧，这个就碾压了，有代差的优势降维打击啦。所以现在这个博弈不仅仅是堆数量，然后那他是觉得这个指令集长了以后会太复杂呀等等的，而且现在芯片越来越牛，还有就是比如说汽车的话，它不像手机，手机对于耗能非常的敏感，因为电池毕竟现在电池技术没有特别大的突破，所以手机芯片的功率限制的非常的饿死他的功耗就几瓦特最多了，再高就不行了。但是汽车的话，它这个能量相对还是比较充沛的，所以他这个算力还是比较澎湃的。就算指令集长一点也能给他算明白，这都不是什么问题，人的神经传导速率一秒100 100米左右，其实相对于这个电传导的速度来讲，人的神经传导速度就像慢动作一样，那人都能开车，再加上以前的燃油车，燃油车反应本来就慢。但是人这种慢动作的反应速度，再加上燃油车，大家也用了几十年了，是不是现在电车反应又快，电脑的反应速度更快，没有问题的嘛。所以我这里面说的就是代码不一定要那么长，其次就算长了巨大的算力不断升级迭代的芯片和算力也能解决，这个问题也能应对。
而且我还给用电视机给他举例子，我说这电视机现在空白的时候，它也不会显示那些噪音了，连电视机这种谈不上智能的东西。他都可以轻易的过滤掉这些杂波，所以这根本就不是问题啊，对了那个嗯，唉，我忘了是塔勒布还是卡尼曼写了一本书叫噪音，我还没看呢，我估计就是探讨这个问题。好像是塔勒小布布。啊，我对他的书还算熟，看过几本，所以我估计他就讨论这个问题，还没看这本书，但是我应该能猜出来他想聊的话题。在复杂环境下想要过滤出来，这个在海量的这些信息和噪声当中，把真正有用的信息和观点给它过滤出来，这确实是需要本事的。但是在驾驶环境当中，偶尔遇到的一些这些问题，我觉得应该不是什么太大的事情，因为我们都知道，其实当个普通水平的司机，他也不是什么特别难的事情，普通人都能做到，那人工智能现在的这个发展水平没有道理做不到的，不是什么太难的事儿。他不是研究海德格尔的书，那个东西有点难，满街都是四级是吧，这个不需要高等学历，都能开车，这有多难啊，那人能做到，机器为什么做不到呢？
而而那位朋友最逗的观点是使用纯视觉的特斯拉能做到，只要你加上一点其他的东西，比如说加上毫米波雷达之后，你就做不到了，我觉得这个有点对，特斯拉好像一神教的一种崇拜一样就把他神化了，如果他觉得都做不到的话，那可能情况还不一样，但是他觉得特斯拉能做到，但是别家就做不到这个，我觉得这是一种宗教般的虔诚。😄

GREED喵Miao 的讨论

作者：GREED喵Miao

热门回复