李士岩表示,数字人产业有三大核心推动力,第一级火箭是用户需求与技术升级、第二级是政策支持与资本涌入、第三级是计算平台的迭代。“每一次数字人发展本质上都是技术推动的,用户从平面的图文影音获取信息与交互,向实时3D交互反馈的需求转变,将成为数字人长期发展的根本动能,未来也将创造大量需求。“李士岩说。
虽然数字人行业拥有强劲的驱动力,但李士岩认为,当下国内数字人要大规模产业落地还面临三大难题。
首先,数字人产业链各个节点相对割裂,不能高效协同,导致数字人在制作和调优上存在较高壁垒,目前行业中大多数公司只是数字人制作与运营全流程上的一环或其中几环。其次,服务场景与演艺场景没有有效打通,表现为演艺型数字人不具备客户所需的业务能力,而服务型数字人缺乏人设,难以与用户进行情感交流。第三是满足高机动性、高频需求的成本依旧很高,这一问题归根结底还是数字人的生产效率问题。
百度推出数字人平台“曦灵”
面对当前数字人制作的高门槛,2021年12月,百度create大会(百度AI开发者大会)上,百度CTO王海峰正式发布了“百度智能云曦灵数字人平台”, 搭建集数字人生产、内容创作、业务配置服务为一体的平台级产品。目前该产品已具备标准平台的快速交付能力,帮助不同领域客户快速实现敏捷型需求,降本增效。百度的数字人平台曦灵具有全场景、一站式、平台化的特点,能支持从最初数字人形象定制、人设管理再到业务编排、内容创作,最后到多种驱动模式下与用户互动的全部需求,这也意味着在一个平台上即可实现数字人的全链路调优,从而将效果做到最好。
李士岩以数字人生成环节为例,演示了百度智能云曦灵平台的功能。用户在百度智能云曦灵平台上传一张照片,就能快速生成一个可被AI驱动的2D数字人像,以前需要两三个月时间做出来的3D数字人,现在可以压缩到小时级,同时还可以通过一句话语音描述或简单捏脸等多种形式快速生产数字人。数字人个性化功能开发也较之前更加完善,以百度刚刚发布的3D超写实口语数字人为例,其口型合成准确率高达98.5%。
在技术催生的数字人3.0阶段,虚拟人可与不同行业产生更紧密的融合。基于市场使用场景,数字人可以分为演艺型数字人、服务型数字人两类。
演艺术型数字人包括虚拟主播、虚拟偶像以及数字孪生的虚拟品牌代言人。目前百度已经打造了AI手语主播、央视网虚拟主持人小C、航天局火星车数字人祝融号、百度虚拟代言人希加加、百度APP代言人龚俊数字人。
服务型数字人包括数字员工、虚拟员工、虚拟业务员等,可以帮助金融、运营商、政府、零售等行业提供基于数字人的新一代客户服务能力,解决排队长、回应慢、人力成本大等问题。目前,百度已经和浦发银行、光大银行、中国联通合作,推出了一对一服务型数字人。
百度在数字人技术上的突破也得益于其在行业内的持续布局。早在2019年,百度就开始了“虚拟数字人战略”。基于多年的AI技术沉淀, AI能力已成为百度智能云曦灵平台的核心能力,现在百度也在把这种能力开放给外界。李士岩表示,“我们近两年的奋斗目标是通过百度智能云曦灵平台的开放,让每个人实现数字人自由。”