人形机器人深度调研纪要

发布于: Android转发:0回复:0喜欢:0

问:智能发展关键节点何时即将到来?

答:人工智能的关键节点即将来临。智能模型的发展经历了从大模型到多模态、再到常识型(AGI)的演化过程,当前正处于多模态融合阶段,从GPT-4到未来的GPT-5,未来可能进入与环境交互的决胜阶段,最终实现与物理世界的融合。

问:具身智能在AI模型中的重要性体现在哪些方面?

答:具身智能作为AI模型中的关键节点之一,对于实现AGI至关重要。它能够处理多种输入类型(视觉、听觉、触觉),通过与环境交互获取知识并提高智能水平。具身智能建立在多模态模型统一理解和生成能力的基础上,实现模态融合和任务融合,推动了具身智能模型的发展。

问:人形机器人相较于传统机器人在复杂场景应用中的优势是什么?

答:人形机器人具有泛化性高、决策可靠、实时精准输入、高速场景算法能力和涌现能力等优势,可以有效应对制造业离散制造业和服务业等复杂场景的需求,与环境沟通学习,有望成为工业集群的补充,推动智能化发展。相比之下,传统工业机器人只能根据算法和规则做出相应判断,无法适应复杂性较高的场景。

问:机器人产业链如何随着全智能时代的到来发生重构?

答:随着具身智能时代的到来,机器人产业链将经历重构,传统的上游零部件供应商、软件系统提供商和设备制造商将受到挑战。新的核心底层算法可能出现变化,对机器人形态、成本、续航能力、零部件性能等提出新需求。传感器、电机、减速器等核心部件性能将大幅提升,同时,端侧芯片算力需求也将大幅增加。下游应用场景将不断拓展,机器人将应用于制造业、服务业、医疗保健等多个领域,其应用场景和能力边界得到大幅扩展。同时,OEM厂商也会选择自研软件系统,并采购上游解决方案。

问:中国的人形机器人组装和生产系统集成开发在哪些行业应用中被广泛采用?

答:中国的人形机器人组装和生产系统集成开发主要应用于工业云领域、制造业(如物流仓储、安保巡检、阶段指引和科研教育等)以及家庭消费类场景,如情感类、家务类和辅助类等to c端应用场景。

问:随着AI技术的发展,巨头公司如特斯拉谷歌如何布局人形机器人领域?特斯拉在人形机器人研发中取得了哪些主要进展?

答:特斯拉从硬件入手,通过基础硬件、基础算法和医学相关的机动性、灵活性、稳定性一体化能力提升,以及降低成本实现规模化。而谷歌则从完全算法和机器人模型为核心入手,不断迭代机器人模型,实现自主可靠决策、多模态感知和实时精准人工结合,并展现出了学习能力和作战能力。特斯拉在2021年10月开始研发,2022年10月发布日期机器人,2023年5月公布机器人在工厂中行走和动作视频,同年9月实现神经网络端到端训练,可以自主分类物体。2023年12月发布第二代人类机器人,并展示出精准运动控制功能。整体上,特斯拉持续提升机器人的稳定性、灵活性、集中性和运动控制能力。

问:特斯拉的人形机器人软件算法是如何借鉴智能驾驶技术的?

答:特斯拉认为人形机器人的算法与智能驾驶系统较为相似,因此部分移植了FSD智能驾驶系统的算法,并采用了3.0芯片。软件算法链路包括感知、决策和控制,与智能驾驶系统具有较高的相似性,能够快速切入人形机器人领域。

问:特斯拉人形机器人芯片的特点及其未来成长平台预计达到的算力水平如何?

答:特斯拉人形机器人芯片架构由大规模计算平面构成,采用7纳米制造工艺,预计在2024年10月成长平台有望匹配30万块A100算力,第三方数据预测其算力投入超过65亿美元。芯片内部优化了GPU之间的通讯协议,相比NVLink架构拥有更高的综合性能,在功耗、算力和成本方面相比英伟达的GPU得到了显著优化。

问:第三方大模型厂商如何进入人形机器人行业?英伟达在人形机器人领域有何重要贡献?

答:以OpenAI为例,该公司通过模型赋能和风险投资方式进入人形机器人行业。其主要投资策略是向人形机器人初创公司提供资金支持。OpenAI的投资活动旨在促进人形机器人领域的技术进步和发展。英伟达不仅从芯片和中间件入手,还发布了边缘计算芯片,采用英伟达的Black White架构,具有800PFLOPS的算力,能够很好地兼容软件平台。此外,英伟达还发布了全基础模型,可在任何环境下为机器人创建新的基础模型,使其能够理解自然语言并模仿人类行为。同时,英伟达还提供了多款智能开发中间件,用于强化学习和计算编程服务,以实现快速软件开发。目前已有超过120万的机器人开发者选择使用英伟达的导航解决方案。

问:传统经验算法与大模型能力在智能系统中的相对性如何体现?

答:在智能系统领域,传统的经验算法基于规则驱动,开发者根据作业规则和需求制定一对一的逻辑决策,通过规则算法库实现,但其应用场景的复杂性限制了其泛用性。相比之下,大模型能力的数据驱动方法具有更高的泛化能力和执行效率,同时降低了对传感器的要求。例如,在特斯拉的产业化过程中,通过数据驱动的大模型降低了生产成本,并有望在未来复制该模式以提升产品的市场渗透率。

问:特斯拉如何实现汽车产业链的降本增效?

答:特斯拉通过商业模式的调整,采用高溢价到评价的策略,从高端产品逐步下沉到更广泛的价格区间,实现了产业链的降本。其在汽车发展路径中,不断优化产品线并降低对能量场地的依赖程度,从早期的多重融合方案到纯视觉方案,再到现阶段逐步增加毫米波雷达和摄像头数量,最终使用单端来源的传感器,降低备用成本。特斯拉有望借鉴并复刻自身减配降本的经验,在落地过程中寻找成本与智能化之间的平衡点。

问:软件厂商如谷歌和OpenAI在机器人领域的发展模式是什么?

答:谷歌和OpenAI作为软件厂商,在机器人领域采取自上而下的策略,通过开发数据驱动的智能模型进入市场,由于缺乏硬件领域的能力,他们通常与汽车制造厂商合作,扮演软件服务商的角色,提升OEM厂商的能力。谷歌和OpenAI可能会参考安卓模式,在人行进程中为机器人OEM厂商提供系统赋能和生态运营服务。

问:在人形机器人产业投资阶段,应关注哪些关键环节和技术?

答:在人形机器人产业投资阶段,重点关注的核心是多模态模型,它是人机交互的核心大脑,目前在应用落地方面存在核心痛点。为了推动多模态机器人的快速发展,需要集成大模型的能力边界得到快速拓展。建议关注大模型相关产业的发展,以及模型训练和推理基础设施的算力材料机会。此外,复盘苹果和其他汽车供应链在国内的布局和落地形式,寻找机器人供应链厂商在人形机械和具身智能爆发后营收和利润大幅增长的潜力,对集成配套零件厂商进行关注。