近了,人形机器人的春天!

发布于: 雪球转发:0回复:0喜欢:0

近日,特斯拉CEO埃隆 · 马斯克宣布了一项计划:不仅将销售最新研发的人形机器人Optimus,并计划将其应用于自家工厂,而且还将提供这一革命性技术的租赁服务。

一、市场空间远超自动驾驶

人形机器人,顾名思义,就是模仿人类形态和功能的机器人。它们通常被设计成具有与人类相似的形态,包括头部、躯干和手脚,并具有一定的智能和自主性,可以在特定环境中执行复杂的任务。

这个新型物种的市场规模到底有多大?

老龄化的加剧、劳动力供需结构的变化、企业用工成本的持续提升,都是催生人形机器人需求增长的重要因素。

在低生育率和寿命延长的双重作用下,全球人口老龄化程度已处于较高水平。

根据世界银行统计,2022年全球65岁及以上人口占比9.8%,其中,高收入国家、中高收入国家分别为19.2%、11.6%;摩纳哥、日本、意大利老龄化居全球前三,分别为35.9%、29.9%、24.1%。中国排名为73名,65岁以上人口占比为13.7%,仍高于全球的平均水平。

中国人口基数更为庞大,经历过计划生育政策的严格推行时期,后续将面临更为严峻的老龄化形势。根据国家统计局,1953-2023年中国65岁及以上人口从2632万增至2亿,占比从4.4%增至15.4%,老龄化明显加快。

随着人口红利的渐退,企业用工成本持续增加。2023年中国制造业就业人员平均工资为9.25万元,同比增长6.4%,2012-2023年复合增长率为8%。

人形机器人,这片高科技的丰饶沃土,已成为生产和服务领域解决劳动力困局的重要战场,其市场空间给人无限想象。

众多机构纷纷给出乐观的预测,而我们更倾向于那些已在实战中脱颖而出、并在行业稳坐领先地位的研究成果,比如马斯克及其团队所取得的杰出成就。

根据马斯克的预测,随着技术的不断进步和应用的不断拓展,人形机器人的数量可能会在未来超越人类,甚至达到惊人的100亿至200亿个。

他认为,虽然自动驾驶技术的市值可能达到5-7万亿美元,但人形机器人的市场潜力可能更为巨大,高达25万亿美元。

二、国家政策不断加码

人形机器人这块巨大的“蛋糕”,引起了主要国家的高度重视。近年来,各国政府纷纷出台扶持政策,将发展重点瞄向了以人形机器人为代表的智能机器人。譬如美国国家机器人计划、日本新机器人战略、欧盟地平线计划、德国2025高科技战略等。人形机器人,这片激烈争夺的市场和技术高地,俨然成为兵家必争之地。

我国也从战略规划、项目专项和产业配套等方面鼓励人形机器人行业的发展,通过政策和资金扶持产业链各环节的技术研发和生产应用。

巨大的市场需求叠加国家政策支持,人形机器人产业具备持续增长的确定性需求。

三、核心技术及主流路线

相比仅能完成单一场景下简单功能的传统机器人,人形机器人具有高度自主意识,可完成通用交互性任务,逐渐走向高度智能化。

人形机器人的发展依赖于AI模型与大数据、高端制造、新材料等多种前沿技术和交叉学科,主要涉及三大核心技术:运动控制、感知能力、人机交互。

1)运动控制

目前,人形机器人的运动控制主要靠两种驱动方案来实现,一是电液混合驱动,二是电驱动。电液驱动在惯量比、响应速度、力密度等方面具备显著优势,但由于噪音大、易漏液、对污染敏感、对液压元件的精度要求高、维修难度大,导致制造成本高,商业化难度大。电驱动主要靠伺服电机系统,通过电机性能迭代、精密减速器优化等途径,有望在各项指标上追赶液驱,此外,电驱动在成本、维护、体积重量等方面均优于液驱。

目前除波士顿动力Atlas采用电液混合驱动方案外,其他厂商基本均采用“电机+减速器”的电驱动方式。

2)感知能力

人形机器人的感知能力包括视觉、听觉、触觉等多方面的感知,其中最核心的是视觉功能。一般通过先进的机器视觉系统(以3D视觉为主),并结合AI算法和多模态感知能力,以实现全面的视觉功能。特斯拉Optimus机器人采取纯视觉方案,其3D传感模块以多目视觉为主,共8个摄像头。其余大多数人形机器人厂商采用ToF(飞行时间)深度相机/立体视觉+激光/超声波雷达的方案。相比纯视觉方案,激光雷达方案的成本更高,同时对软件算法的要求相对偏低。

3)人机交互

人形机器人的交互功能最主要的发展方向是语音识别,其核心是以口头语言(语音)和书面语言(文字)为研究对象,对其进行识别、理解及生成,从而使机器具备能听会说、能理解会思考的能力。

此外,自然语言处理能力的提升,尤其是AI大模型的出现,使得人形机器人与人之间的交互变得前所未有地多样化和紧密。2023年4月,AI公司Levatas与波士顿动力合作,将ChatGPT和谷歌的语音合成技术接入Spot机器狗,成功实现与人类的交互。

四、面临的技术瓶颈及挑战

人形机器人的研究,最早可追溯到1950年由图灵提出的“具身智能”。数十年来,“具身智能”作为人形机器人的理论基础,引领着人工智能技术和相关产业的发展,相关研究也渐趋成熟、不断深化。

当前,国内外已发布和在研发的人形机器人,包括特斯拉Optimus,距离真正意义上的“具身智能”还相当遥远。

探究实现“具身智能”的主要路径和方法,将是未来产业界的重要议题。

目前的主流观点是将AI大模型接入人形机器人,并深度赋能实现真正的“涌现”。2023年,随着ChatGPT、文心一言、讯飞星火、盘古等大模型的问世,人们看到了实现通用人工智能的曙光,纷纷探究AI大模型+人形机器人的可能性。

2023年7月,斯坦福大学的 AI 科学家李飞飞带领的研究团队公布了一项具身智能领域的新成果,利用大型语言模型(LLMs)和视觉语言模型(VLMs)来驱动机器人。大模型接入机器人,把复杂指令转化成具体行动规划,无需额外数据和训练。比如桌上有一个小抽屉,她向机器人下达指令:“打开上面的抽屉,同时小心不要碰到花瓶”。大语言模型(LLMs)+视觉语言模型(VLMs)就能从3D空间中分析出目标和需要绕过的障碍,帮助机器人做行动规划。

此种在机器人未经“培训”的情况下,通过大模型的涌现能力和思维链能力,零样本学习执行相应任务的能力,正是“具身智能”的一项重要功能。而要实现高度自主决策的具身智能,我们在算法、工程技术、数据、场景和复杂软硬件等方面仍面临的诸多挑战。

此外,随着人形机器人越来越普及,涉及到的道德伦理和隐私安全问题也引起了广泛的关注和研究。例如,人形机器人是否应该拥有与人类相似的权利和义务,人形机器人如何保护用户的隐私和数据安全,如何避免人形机器人对人类和环境造成损害等。相关法律法规的制定与完善,也将是我们需要突破的难点。

结语

随着深度学习、强化学习等人工智能技术的不断发展,人形机器人的学习能力将得到进一步提升,其感知能力、运动控制能力、人机交互能力也将更加精确和高效。未来的人形机器人将更加注重智能化和自主性,更好地胜任各种复杂任务,为人类带来更加便便捷的生活体验。