华泰 | 传媒:虚拟数字人+AI,产业加速度

发布于: 雪球转发:0回复:0喜欢:2

正文

AI赋能虚拟数字人,行业发展有望加速

AI技术助力虚拟数字人实现多模态交互

传统意义上,虚拟数字人指通过计算机图形学、图形渲染、语音合成技术、动作捕捉、深度学习、类脑科学等聚合科技创设的非物理世界的可交互虚拟形象。

拟人化是虚拟数字人的核心特征

参考中国传媒大学《中国虚拟数字人影响力指数报告(2021年度)》等相关研究,虚拟数字人的核心特征是拟人化,具体表现出三方面特征:

1、 外观形象拟人化:具有“人”的形象,如特定相貌、性别等特征;

2、 行为表达拟人化:具有“人”的性格行为特征,如语言表达、面部表情、肢体动作等;

3、 思想交互拟人化:具有类“人”的互动能力,如觉察外界环境、交流互动等。

虚拟数字人的分类方式多样。由于虚拟数字人的核心价值是提供类“人”服务与体验,通常从交互能力和拟人化视觉风格两方面分类:

1、 按交互能力划分:虚拟数字人分为交互型和非交互型,划分标准为是否具有交互能力。对于交互型虚拟数字人,进一步又可以按照驱动技术划分为AI驱动型和真人(中之人)驱动型两类。相较于真人驱动型的虚拟数字人,AI驱动型虚拟数字人能够通过智能系统自动读写识别外部信息,自主决策并驱动人物模型完成用户交互。

2、 按拟人化视觉风格划分:虚拟数字人可以分为二次元型、超写实型和数字孪生型。其中,二次元型具有动漫风格,超写实型近似真人,数字孪生型是创造一个虚拟的“数字分身”。

AI助力虚拟数字人多模态交互体验,“一站式”实现虚拟数字人生产全流程

AI技术对虚拟数字人的赋能体现在两个方面:

1、 AI+虚拟数字人具有无需人工干预的自动交互能力,提供多模态交互体验。在AI技术助力下,虚拟数字人交互方式发生转变,从文本语音拓展至图片、音视频等,提升交互体验。在单模态大模型的自然语言处理技术下,虚拟数字人与用户的交互方式局限于文本、语音等单一模式,如聊天机器人等。随着AI模型及应用向多模态的升级迭代,自然语言处理能力与计算机视觉、图片与音视频生成能力得到有效结合,经过丰富数据库预训练,多模态大模型应运而生。如ChatGPT、文心一言等。

2、 AI技术帮助实现虚拟数字人的创建、驱动与内容生成“一站式”全流程。传统的虚拟数字人的核心技术流程主要包括CG建模(Computer Graphics)和NLP(Natural Language Processing)交互技术,前者运用计算机技术完成虚拟数字人外观设计,后者用于建立对话交互能力。AI技术将帮助“一站式”实现虚拟数字人的创建、驱动与内容生成全流程,降低相关成本。

未来趋势:虚拟数字人发展迈向AI驱动、工具化、系统化、低成本新阶段

当前,AI+虚拟数字人的发展趋势,主要包括如下三点:

1、 驱动方式迭代:从真人(中之人)驱动型向AI驱动型迭代。真人驱动型虚拟数字人的人物语音动作、面部捕捉技术、动作捕捉技术和音视频合成等均需要中之人于后台配合完成。随着AIGC全面赋能虚拟数字人,AI驱动型虚拟数字人能够通过深度学习模型、神经网络渲染、自然语言处理等技术的有机结合,使之具有感知、表达等无需人工干预的自动交互能力,摆脱中之人的技术局限。同时,AI驱动型虚拟数字人具有根据不同应用场景特点配置相应的交互与内容创造能力,并“一站式”实现虚拟数字人的创建、驱动与内容生成全流程。

2、 底层架构转变:迈向工具化与系统化,拓宽应用领域。一方面,AI技术形成便捷开发、高效系统的底层技术新架构,AI+虚拟数字人可以通过训练模型完成对不同行业知识图谱的学习与应用、为用户提供高效率、低成本的实时服务。另一方面,AI+虚拟数字人应用领域较传统虚拟数字人更广泛,未来有望从传统的虚拟偶像、游戏等核心领域,向外辐射至直播、电商、教育、医疗、文旅、社交乃至全行业。

3、 成本转变:降低人力与开发运营成本,实现规模效益。首先,AI技术助力完成文本、图片、音视频等多模态内容的“一站式”智能化生成,有助于摆脱传统的“中之人”技术对人力的依赖,降低人力成本。同时,随着底层架构的工具化与系统化,虚拟数字人开发成本大幅下降,相关算法优化迭代也将降低运营传播成本。再者,此轮大模型变革催生出的平台型基础技术架构,将大幅降低虚拟数字人的研发与推广成本,AI交互技术门槛的降低,也将带动AI+虚拟数字人在多行业全领域的覆盖,实现规模效益。

AI+虚拟数字人行业处于高速发展期,政策环境友好

AI+虚拟数字人处于高速发展期,市场规模天花板高

根据头豹研究院《2023年中国AI驱动虚拟数字人行业词条报告》,AI+虚拟数字人的发展历程大致划分为三个阶段:

1、 萌芽期(2010年-2015年):受限于CG技术、语音合成技术等的不成熟性,AI+虚拟数字人市场规模小,仍处于技术探索的初级阶段;

2、 探索期(2015年-2020年):随着愈发成熟的AI技术的加持,AI+虚拟数字人的应用场景日趋多元,步入产业融合的探索期。2016年12月,全球首个虚拟主播“绊爱”开设YouTube频道;2018年,银行业出现首个数字虚拟员工;新华网和搜狗联合研发“AI合成主播”;

3、 高速发展期(2020年至今):近年来,深度学习模型向多模态发展带来AI+虚拟数字人的多模态高速发展新阶段。AI技术在全方位渗透全产业的基础上,进一步融合文字、语音、图片、音视频等多模态方式促进虚拟数字人产业走向新的阶段。各公司把握行业发展机遇,积极研发出一系列AI+虚拟数字人,如创壹科技的虚拟美妆达人“柳夜熙”、元圆科技虚拟偶像天妤、百度推出的全球首个实现AIGC的虚拟偶像希加加等,在艾媒咨询《2023年中国虚拟人百强榜》中表现亮眼。

我国虚拟数字人市场规模天花板高、潜在空间大。根据iMedia Research艾媒咨询数据,近年来,我国虚拟数字人市场规模呈现加速增长趋势。2022年虚拟数字人市场规模已达120.8亿元,带动周边市场规模为1,866.1亿元。当前,随着ChatGPT、“文心一言”等大语言模型的发布,AI+虚拟数字人的发展领域将进一步拓宽。艾媒咨询预计到2025年,核心市场规模将达到480.6亿元,带动周边市场规模近6,402.7亿元。

虚拟数字人产业链由基础技术层、平台层和应用层组成,覆盖多领域应用场景

虚拟数字人产业链由上游基础技术层、中游平台层和下游应用层组成,覆盖多领域应用场景。AI+虚拟数字人背后的技术流程较为复杂,基于虚拟数字人生产开发及应用过程中涉及的不同阶段,其产业链主要由上游基础技术层、中游平台层和下游应用层组成。

1、 上游基础技术层:基础软硬件设施。英伟达Meta、Epic Games、Unity等企业为代表,为虚拟数字人的生产制造提供底层技术支持,包括2D/3D显示设备、数据采集所用的传感器、承载算力的计算设备、数据预处理所用的芯片、动作捕捉所用的光学器件等基础硬件设施,以及虚拟数字人三维建模、外形渲染引擎等基础软件设施;

2、 中游平台层:AI厂商、综合性互联网厂商一站式技术支持。微软腾讯等综合性互联网厂商,科大讯飞商汤科技等AI专长类厂商,原力数字、相芯科技等CG(Computer Graphics)和XR(Extended Reality)技术厂商,以及魔珐科技、拟仁智能等垂直虚拟数字人厂商为代表。平台层企业对上游基础硬软件技术加以融合,结合自然语言处理、计算机视觉等虚拟数字人核心技术,为下游应用层提供动捕、建模、渲染等制作环节的进一步技术支撑以及一站式虚拟数字人解决方案;

3、 下游应用层:从泛娱乐行业向全方位多领域应用场景辐射。运营方赋予虚拟数字人内容生态和应用场景,包括影视、游戏、媒体等领域的数字角色、虚拟演员、虚拟主播、虚拟主持人,教育领域的虚拟老师,医疗领域的虚拟问诊医生,金融领域的虚拟客服、虚拟理财顾问,文旅领域的虚拟导游、虚拟讲解员,零售领域的虚拟代言人等。下游应用层企业将虚拟数字人技术与传统行业相互融合,实现多领域应用场景覆盖。

国家高度重视支持,虚拟数字人行业政策环境友好

AI+虚拟数字人多场景应用:全方位赋能升级

按照是否有IP影响力,虚拟数字人分为身份型虚拟数字人和服务型虚拟数字人:

1、 身份型虚拟数字人通过制定个性化IP吸引流量。以虚拟偶像、虚拟IP为代表的身份型虚拟数字人的商业模式是设计定制个性化身份IP吸引流量变现,当前以真人驱动(中之人)型为主,虚拟偶像、虚拟IP、虚拟代言人等均属于此范畴,如虚拟美妆达人柳夜熙、创意复现虚拟数字人苏小妹等;

2、 服务型虚拟数字人通过提供定制化服务,直接变现。服务型虚拟数字人旨在代替真人服务以降低服务业人力成本,涵盖领域包括营销、政务、文旅、金融等全行业,过去受到技术限制,主要应用于代替基础标准化业务,交互能力不高。

AI技术助力两类虚拟数字人行业发展,我们将从游戏、偶像文娱、新闻媒体、营销、电商、社交、金融和教育文旅八个维度展开对AI+虚拟数字人应用的场景分析。

游戏:虚拟数字人提升游戏体验,实现人格化

虚拟数字人从游戏中来:游戏行业是AI技术运用的前沿先行者,游戏技术研发推动虚拟数字人行业发展。

1、 游戏产业是AI技术赋能虚拟数字人的先行者。游戏行业在AI技术运用方面走在前沿,AI技术通过生成游戏角色的动画表情、提供角色外型定制化、生成游戏角色的智能行为等,使玩家在游戏中获得栩栩如生的虚拟数字人形象,增强玩家在游戏互动中的沉浸感,提升游戏的可玩性、趣味性和互动性。

2、 游戏产业推动虚拟数字人行业的形成和发展。游戏行业由于自身特点,在角色制作、IP搭建、用户交互等方面积极研发与探索,在人物建模、动作捕获、虚拟数字人IP运营等方面积累的了一系列经验,推动虚拟数字人行业的形成与发展。

3、 游戏产业推动AI技术迭代创新,打破虚拟数字人发展技术壁垒。如当前Unreal Engine、Creation等游戏引擎已经基本上使虚拟数字人实现了从“很像”到“很真”的跨越。今年4月,世界上第1款基于ChatGPT制作的游戏《生成智能体:人类行为的交互式模拟》在斯坦福大学和谷歌研究院诞生,开发者通过使用25个数字人填充一个类似模拟人生的沙盒RPG游戏。

虚拟数字人到游戏中去:打造虚拟游戏人IP,AI技术赋能下反哺游戏产业。

1、 在游戏中加入AI驱动型虚拟NPC,增强游戏人格化与陪伴感。2023年2月15日,网易旗下开放世界武侠手游《逆水寒》宣布实装国内首个游戏版ChatGPT,让智能NPC能和玩家自由生成对话,并基于对话内容,自主给出有逻辑的行为反馈,这也是国内类ChatGPT首次应用在游戏。据《逆水寒》官方介绍,游戏中智能NPC的所有对话文字、表情、语音、镜头均由AI自由生成,其中语音为临时的机械版本,待正式上线时还会根据NPC性格进行迭代提升。通过使用和ChatGPT同源的底层AI技术,网易打造出了“会呼吸的NPC”,具备随机自由交互的能力,带动游戏情节延展;国产头部游戏IP《仙剑奇侠传》推出的首位虚拟数字人“龙葵”以轻短剧的形式登陆各大主流短视频平台,未来将实现与玩家在虚拟世界跨次元互动,增强游戏人格化,提供更好的游戏体验;汤姆猫围绕“会说话的汤姆猫家族”的虚拟形象,通过AI技术实现IP价值的深度变现。根据23年3月6日-8日公告,公司已尝试应用GPT-3.5模型进行AI语音互动产品功能原型测试,已将汤姆猫IP形象植入产品功能原型中,加入语音识别、语音合成、性格设定、内容过滤等功能,并测试了语音交互、连续对话等产品性能,提高汤姆猫虚拟数字人IP的交互体验。

2、 打造数字代言人,拓宽游戏变现模式。头部游戏公司推出的AI虚拟数字代言人如《QQ炫舞》的星瞳和《和平精英》的吉莉,引发广大关注。吉莉就是典型的产生于游戏,终又反哺游戏的代表,参加央视的《五四青年节特别节目》,出席联合国妇女署活动进行演讲,打破了虚拟与现实间的墙壁。

虚拟偶像的盈利模式是平台流量变现,变现途径多元化。我国虚拟偶像主流活动身份分为:虚拟歌手、虚拟up主(发布内容以视频为主)和虚拟博主(发布内容以图片和文字为主)三类。当前,中国虚拟偶像行业进入高速发展期,根据艾瑞咨询《2022年中国虚拟偶像行业研究报告》预测,中国虚拟偶像行业2019年以来保持较高增速,未来随着AI技术加持,有望开启新一轮高速增长。基于平台变现的商业模式,虚拟偶像商业变现途径多元,在广告、电商主播、演出、代言、旅游、宣传等多领域辐射,实现粉丝经济变现。上海禾念信息科技有限公司旗下虚拟歌手洛天依等Vsinger歌手以二次元形象出道,除推出个人专辑外,还会售卖手办、生日卡片、节日礼盒等周边;其他创收渠道还包括品牌联动、代言等。在2023年(第二届)中国虚拟数字人产业大会暨AIGC创新发展论坛中,公司旗下虚拟歌手洛天依、言和、乐正绫、乐正龙牙、墨清弦等均入围艾媒咨询《2023年中国虚拟数字人百强榜单》。

摆脱中之人,走向可交互的AI驱动虚拟偶像。当前,我国虚拟偶像驱动仍主要通过真人动捕设备由中之人实时扮演虚拟偶像完成;在AI技术加持下,依靠AIGC能力的AI驱动型虚拟偶像应运而生。如百度推出的国内首个可交互虚拟偶像度晓晓,基于百度大脑7.0技术展现出强大交互能力;百度推出的全球首个实现AIGC虚拟偶像希加加,可以进行AI思维创作,实现AI剪辑、AI作画、AI作曲等,成为麦当劳产品首位虚拟推荐官。

AI赋能虚拟偶像的内容创作、平台支持等。除升级虚拟偶像的创建外,AI在底层技术、内容创作、平台支持等多领域赋能虚拟偶像产业。

1、 赋能内容创作,推动AI+音乐发展。一系列生成式AI大模型的出现,降低AI翻唱的技术门槛。“冷门歌手”孙燕姿在5月重新成为活跃乐坛的顶流,“AI孙燕姿”靠翻唱再次走红,哔哩哔哩创作者“陈墨瞳1995”“罗斯特_x”“Eternity | L”发布《下雨天》《发如雪》等翻唱视频收获视频播放量破百万,开创华语乐坛复兴新模式。科大讯飞推出的AI虚拟歌手Luya,是旗下讯飞音乐在AI+音乐领域的又一探索。作为AI虚拟歌手,Luya出道的意义不仅在于唱歌,更重要的是AI深度赋能音乐领域发展。Luya与上海音乐学院合作,未来会从唱歌进一步延伸到AI辅助作词、作曲等领域,和上音一起进行不同类型音乐风格的融合实验,比如利用技术手段匹配风格相近的歌曲、拆解和弦和旋律走向、融合曲目等,从而推动音乐在基础理论、创作方面进行创新和拓展。

2、 推出数字藏品,走向超写实时代。格兰莫颐文化艺术集团推出的虚拟偶像ALiCE,是国内首个实现AI深度运用的超写实虚拟偶像,也是国内首个情绪艺术智能。ALiCE以音乐、时尚、艺术的多元身份在不同领域游走,已成为国内独一无二的时尚符号。出道以来,虚拟数字人ALiCE已先后与多家知名品牌合作,其中包括GUCCI、GIVENCHY、Urban Decay等。2023年2月,虚拟数字人ALiCE在唯一艺术平台推出CODA化身-R主编ALiCE系列数字藏品,讲述虚拟数字人眼中的元宇宙。虚拟数字人代言的产品具有收藏价值,能够抓住更多年轻消费群体,实现价值变现。

3、 搭建虚拟平台,IP矩阵赋能多元领域。AI技术还能搭建虚拟平台实现“底层技术-虚拟偶像-平台支持”三位一体发展模式,如百度集团以度晓晓、希加加为核心的数字人IP矩阵,兼具科技感基因属性、超强知识属性和独一无二的性格人设,有效满足品牌方的情感需求、流量需求,全面赋能内容营销。AI将向多领域辐射,如元圆科技推出的以天妤、安思鹤、颜之初为代表的虚拟IP矩阵框架,通过“科技+文化”“小人物、大情怀”等形式讲述故事,收获百万粉丝的喜爱。基于对元宇宙经济的敏锐洞察和对数字经济机遇的把握,元圆科技以“前沿科技+多元化内容+全流程运营服务”,助力文旅抢占数智时代发展新机遇。未来,元圆科技将加持“创意+内容+技术+运营”的行业优势,进一步实现AI技术对虚拟展厅、数字藏品等的赋能。

新闻媒体:赋能新闻行业,推动媒体融合

丰富媒体内容,拓展受众人群。以AI生成的新闻报道为例,传统新闻报道需要专业的新闻编辑、记者及主播来完成,需要花费大量的时间和精力去整理准备,使用AI+虚拟数字人技术完成新闻报道,可大大减轻编辑、记者及主播的负担。目前新华社、中央广播电视总台、人民日报社等国家级媒体及湖南卫视等省市媒体都开始积极布局应用AI合成主播,并推动其从新闻播报向晚会主持、记者报道、天气预报等更广泛的场景应用,为全国两会、冬奥会、冬残奥会等重大活动传播深度赋能。

央视频手语主播“聆语”,正是腾讯云小微基于新一代多模态人机交互技术所打造的全新数智人矩阵中的产品之一,依托于腾讯云小微深厚的NLP、知识图谱、视觉等全栈AI底层能力,这类AI虚拟数字人具有强大的形象表现力、识别力和感知理解能力,还可以根据不同的媒体平台的特点和能力,生成适合其展示和传播的内容,并根据不同的媒体产品和受众,调整其平台的选择和组合。能提高媒体平台效率、增强其呈现效果,同时增强媒体平台之间的互动和融合。

新华社联合搜狗公司推出的全球首位3D版AI合成主播“新小微”,是以新华社记者赵琬微为原型,基于多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,使机器可以基于输入文本生成逼真度极高的3D数字人视频内容。“新小微”不仅立体、灵活,可控,还具有同时支持多机位多景深,360°任意角度呈现内容等能力,在应用空间上拥有更多的可能性,为新闻节目多样化制作和呈现带来了更多选择。随着3D虚拟场景不断拓展,“新小微”将走出演播室,在不同场景中更好地满足新闻呈现的多样化需求,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。

创新自媒体/短视频创作,扩大流量影响。AI+虚拟数字人具有真人不具备的一系列优势:

1、 从工作时长看,能够持续吸引流量。AI+虚拟数字人不知疲倦,不会辞职,保证24小时无休等,能够源源不断地吸引流量;

2、 从成本看,降低人力和物力成本。AI+虚拟数字人没有培训费、月薪等软投入,只需在前期缴纳一笔几千元的定制服务费,大大降低了人力成本和物力成本;

3、 从工作效率看,具有轻资产、冷启动短、效率高的特征。对各类短视频创作者或自媒体而言,AI+虚拟数字人具有轻资产、冷启动短、效率高的特征,缓解了真人出镜的种种麻烦,提高工作效率。

AI+虚拟数字人赋能短视频运营,开创“AI+虚拟数字人+短视频”新模式。“AI+虚拟数字人+短视频”形式正在颠覆传统传媒模式。2021年10月,创壹科技旗下虚拟数字人“柳夜熙”在抖音发布第一条视频,发布6小时涨粉10万,30小时涨粉130万、获赞273万,“当美妆遇到元宇宙”相关话题最高冲上抖音热榜第二名。通过选题、PPM、拍摄、后期、成片等流程,创壹科技通过稳定的中台系统提高短视频的创作标准,持续创作爆款短视频,显著提升短视频粉丝量的积累。

据新榜,目前已有不少网络大V借助虚拟数字人协助短视频制作,例如润米咨询创始人“刘润”,“骆骆整理说”,“大巫聊装修”等。2022年10月,刘润就透露其在短视频上的内容大部分是数字虚拟数字人分身完成的。刘润抖音账号基本实现短视频日更,对于数字虚拟数字人分身完成的短视频,屏幕侧边都打上了“本视频部分画面使用AI技术制作”的字样,从效果来看,短视频里的数字人刘润五官神情生动、手势丰富多样、衬衫领处的褶皱都清晰可见。

营销:创新营销模式,促进业务增长

升级企业品牌代言,提升品牌影响力。华凌作为专注跟年轻人打交道的年轻家电品牌,抢先占领了家电市场的元宇宙赛道。华凌为美的集团旗下面向年轻人群体的品牌,从2019年就开始布局虚拟现实应用,探索年轻消费者的独特审美品味与消费需求,实现品牌与年轻消费者的深度互动,并打造了“凌魂少女”作为品牌的形象代言人,与前卫先锋、年轻躁动的Z世代消费者打成一片。而如今面对元宇宙的新数字化趋势,华凌进一步布局自有品牌IP的数字化升级迭代,从二次元进阶为超写实虚拟数字人,始终以虚拟数字人“凌魂少女”形象统领企业从产品端到消费者使用端的体验,通过商业、营销、产品应用,创新呈现品牌“智能家居”形象,为企业创造营收。

提供智能导购服务,促进购物效率提升和客户增长。AI虚拟数字人可以成为企业在线员工,依靠系统的企业知识库,为用户提供7*24小时随时服务,协助企业完成重复性工作,并大幅提高基础工作的准确性和服务质量。美到家的虚拟数字人“AI Wendy”是由3D技术构建的智能导购小姐,能够通过摄像头判断顾客的面部特征,并从软件云端数据库中调取相关面部知识图谱与美妆知识图谱,帮助顾客选择适合的口红、粉饼色号,以实现销售转化,其知识图谱则是美到家过去数年化妆师、造型师、美容师等贡献的数据。虚拟数字人导购拉近与年轻消费群体的距离,帮助品牌提升互动效果,还给用户带来新鲜的视觉体验,为企业降本增效,带动业务增长。

产出定制内容IP,深化品牌价值。海尔开创深度内容营销的先河,1995年更推出212集动画作品《海尔兄弟》,通过有趣的故事传播科学和人文知识,成功地将海尔品牌植入当时“小朋友”的心中。在元宇宙时代,虚拟人技术赋能海尔兄弟“爷青回”,以3D全新形象重回短视频平台。海尔兄弟内容IP的成功,是深入的内容营销,对品牌价值的生动诠释,对品牌故事的完整讲述。伴随着时代和技术的进步,海尔兄弟仍可以在内容传播和社会互动方面巩固品牌“基盘”,也收获了大量年轻粉丝和订单。

电商:助力电商直播,降本增效进行时

打造虚拟直播新场景,满足电商商家多种需求。中科深智基于自研的CLAP大模型算法和Motionverse业务中台,打造了能满足众多电商卖家需求的虚拟直播工具百宝箱“自动播”。该工具可支持电商平台3D虚拟人主播、虚拟直播间、虚拟人客服、虚拟人直播助理等可视化RPA功能。同时,中科深智汇集超写实虚拟人生成系统-AnyHuman、自研3D AIGC系列产品AI快速动画生成系统-自动画、高效的虚拟人实时交互和应答系统-云小七等,将打造不同场景下的AI工具集,为包括电商场景在内的行业场景提供一站式的解决方案,全方位实现降本增效。

腾讯云于4月25日发布智能小样本数字人生产平台,三分钟完成建模、成本仅有数千元;也有深耕该领域的专业公司,硅基智能创始人兼CEO司马华鹏此前公布的数据显示:硅基智能至今已生产了近150万个虚拟数字人,和4万多个电商带货直播间达成合作;此外,一大批“野生卖家”栖息在闲鱼、拼多多、小红书等平台,几百元就可以打包售卖AI+虚拟数字人设备,还提供代运营服务。根据深响公众号发布的关于AI主播调研情况,直播间的AI主播为2D超写实,通过技术复刻还原表情、声音和形象,获得一个与真人相差无几的虚拟数字人,用户只需一台电脑便可以产出短视频、实现24小时直播,成本更低、制作周期更短、人人皆可用。

百度AIGC技术强势赋能电商虚拟直播。百度智能云的虚拟形象直播解决方案提供PaaS+SaaS+内容资源的多层次服务,PaaS层为开发者提供形象生成、形象驱动、直播推流等SDK能力,SaaS层为主播们提供超写实形象构建、动捕驱动软硬件、直播导播开播系统,同时提供丰富的数字资产内容库。2023年5月,百度发布2023年数字人电商直播解决方案“慧播”,即百度电商数字人直播企业可超低成本获得2D真人形象的数字人配置通过百度领先的AIGC技术能力,赋能直播全链路最终形成完整生动智能高效、低门槛的直播间形态。该直播方案提供全流程直播策略,包括直播前的智能搜索和智能推荐、直播中的智能客服和广告投放以及直播后数据智能分析,帮助企业分析单品销量数据并为其用户画像,助力企业全面提效并实现长期经营。

社交:创造虚拟形象,提供情感陪伴

小冰虚拟恋人是AI虚拟数字人在社交场景的重要应用,近日宣布启动“GPT克隆人计划”。小冰公司前身是微软互联网工程院人工智能小冰团队,是微软全球最大的人工智能独立产品研发团队。早在2010年8月,小冰便陆续发布了虚拟男友、虚拟女友产品线,可供用户定制恋人形象,并提供聊天服务。2020年5月,小冰内测虚拟男友项目,用户在短短7天内创造出了118万个虚拟男友。同年8月,在第八代小冰年度发布会上,微软发布了AI Being小冰框架,在产品中引入内容主动学习技术、分层知识图谱技术,使虚拟恋人人机交互更接近人类表现。公司CEO李笛透露,截至2020年夏季,小冰AI恋人全球覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,且用户群体正在扩展。在MEET 2022智能未来大会上,小冰公司宣布2025年大阪世博会期间,小冰框架将会创造60万个不同个性的虚拟数字人“陪护者”,进入老年家庭,提供24小时不间断陪伴,同时也会向当地政府提供这些老年人的健康情况预警服务。2023年5月16日,小冰公司宣布启动“GPT克隆人计划”,最短只要采集三分钟数据,即可为明星红人、专家学者或普通人创造源于本人性格、技能、声音、外貌的AI克隆人,如同人类在平行世界的第二人生。计划现已在中国、日本启动报名,首批克隆人在一个月内正式上线。

金融:应用于金融领域,推动银行数字化转型

传统虚拟数字人在金融业的应用仅限于常规问题的自助问答、业务办理指引等,随着AI技术发展以及相关技术在银行业等金融领域的落地,AI虚拟数字人的开放式对话、跨模态语义理解、金融数据处理及理解能力得到大幅提升,在智能客服、数字员工等场景的应用能够进一步提升客户体验,提高运营效率。工商银行于2020年12月启用数字人员工“小天”,主要提供业务咨询、产品介绍、机具引导、机器人协同、扫码取号、闲聊等服务。银行将数字人互动区域部署在客户等候区和高柜附近,便于客户看到,“小天”借此机会介绍工行产品和相关业务,产生自然互动。。

银行业数字人的应用场景主要包括两个方向:

1、 对外:面向银行客户,作为线下网点的智能柜员与客户直接进行交互,通过银行线下大屏来实现第一手的接待或服务。此外,还包括银行电销和关键业务办理引导的线上智能客服等;

2、 对内:面向内部员工进行培训,除课程教学外,还需进行模拟性的演练,主要是针对客服、营销的复杂场景模拟,数字人员工替代真人对练可以实现降本增效。

教育文旅:加码服务业,教育文旅齐发力

传统虚拟数字人在服务业领域应用当中互动性不足、互动场景有限,无法为用户提供个性化的交互体验,在AI技术加持下,AI虚拟数字人强大的自动交互能力为其在教育、文旅等服务业领域打开市场。在教育领域,网易伏羲已开发出多款“AI+教育”的创新产品,向师生普及人工智能相关知识、提供沉浸式互动学习体验,虚拟数字人正是其以AI技术驱动创新的场景之一。网易伏羲联合有道乐读推出虚拟数字人学伴“可可”,提供轻量化、情感化的AI交互体验,提高老师的备课效率和课堂趣味性。科大讯飞AI虚拟人在教育领域也有相关运用:在自主研发的T10系列讯飞AI学习机中,瑞恩熊AI英语板块能够实现AI虚拟人老师一对一互动,通过模拟真实口语对话场景,鼓励孩子开口说英语,并结合原创IP冒险系列故事,专为5-10岁打造少儿英语互动课程。

在文旅领域,中国电信已着手AI+虚拟数字人布局,在2022年中国国际服务贸易交易会上,中国电信开辟了元宇宙北京紫禁城“数字观光路线”,以数字虚拟技术在现场呈现出紫禁城太和殿场景,古装仕女装扮的虚拟数字人“导游”负责介绍景点、与游客猜灯谜,实现人机交互。此外,杭州中国丝绸城定制了一系列虚拟讲解员、虚拟诗人、虚拟舞者等多元化的虚拟数字人,提升传统文旅地标的服务智能化水平和消费者购物体验。

他山之石:国外虚拟数字人技术领先,AI创新突破

微软:研究院发力人工智能框架虚拟数字人“微软小冰”

三星:布局AI驱动的“人工智人”项目NEON

韩国三星长期布局人工智能领域,研发领域从早期人工智能助理Bixby进阶为现阶段AI驱动虚拟数字人NEON。致力于“确保领先的AI核心技术和平台是具有发言、识别、思考能力的拟人化AI服务,且可为用户带来人工智能驱动的新体验及价值”,在通过研发人工智能助理Bixby提升在手机、电视等硬件的使用体验后,公司在2020年由旗下独立研发机构STAR Labs推出以CORE R3平台、SPECTRA平台等关键AI技术赋能虚拟数字人NEON项目。

2020年NEON虚拟数字人作为STAR Labs独立开发的结合如人工智能、机器学习、虚拟现实和增强现实等前沿技术和产品的“人工智人”(Artificial Human)项目在CES 2020上正式展出。NEON作为以真人尺寸存在于屏幕中的AI+虚拟数字人,实现如真人般快速响应对话、做出真实的表情神态等功能,同时在对人物原始声音、表情等数据进行捕捉并学习后,形成如人脑般长期记忆功能,以构建机器学习模型。基于以上设定,每个NEON都形成自己独特的记忆。

CORE R3平台、SPECTRA平台以AI为关键技术,帮助NEON实现沉浸式体验。

1、 CORE R3软件技术平台为逼真的头像制作动画,用于电影、增强现实体验以及网络和移动应用程序。在行为神经网络、进化生成智能和计算现实领域,实现了跨越式发展,这是让NEON以逼真的方式快速响应的原因。CORE R3从自然的规律性与复杂性中受到启发,对人类的外观、动作与互动的方式进行了大量的模拟与训练,从而能够生成肉眼无法辨别的、栩栩如生的形象。CORE R3系统的时延不足几毫秒,确保了NEON能够实时地完成动作与回应。CORE R3平台可以与其他的专业或增值服务的系统进行连接。

2、 公司正在开发中的SPECTRA平台,将从智力、学习、情感与记忆等方面,与CORE R3 平台互补,负责智力、学习、情绪和记忆,进一步赋能NEON,从而使NEON达到“沉浸式”的体验感。

Activ8:MCN公司开启主流二次元形象vTuber时代

日本虚拟娱乐公司Activ8主营MCN,其商业模式和真人的YouTuber相似。2016年11月,Activ8推出世界第一个虚拟主播绊爱,并首次使用了Virtual YouTuber这一概念(以下简称vTuber),开启以vTuber为主的二次元风格虚拟数字人新时代。

绊爱自称有思想的独立AI,知道自己是人类开发的虚拟数字人。因开始思考“人类为什么要开发我呢”而对人类感到好奇,由此开设频道试着与人类接触。由于自我意识觉醒于2016年6月30日,因此把6月30日当作自己的生日。与完全电子合成的初音未来不同,绊爱的声音和动作都有真人(中之人)实时对应。通过动作及面部捕捉技术,绊爱能更加灵活地与观众交谈互动,进行长时间直播。绊爱出道后很快走红,YouTube主频道和游戏分频粉丝总数超400万,视频总播放量超6亿。先后发行单曲、开演唱会、出演电视节目/游戏/动漫等,以至于Activ8成立独立公司Kizuna AI事务所,专门处理绊爱相关事务。

Aww:拓展超写实vHuman虚拟数字人

日本第一家写实虚拟数字人经纪公司Aww创立于2019年,是日本第一家vHuman公司。公司旗下拥有imma、plusticboy、Ria等知名vHuman,全平台累积粉丝超100万。公司以亚洲与北美为主营市场,KFC、SK-Ⅱ、Magnum等品牌都与其合作过,目前公司整体已进入头部vHuman公司队列。除了运营虚拟数字人并广告变现外,Aww还开发了独家制作引擎MASTER MODEL,为公司拓展外包业务。

vHuman虚拟数字人广告变现:与主流的二次元向vTuber相比,vHuman作为其衍生出的分支,其超写实与富有新颖感的特性让vHuman与广告代言高度匹配,可以通过广告实现稳定变现。2019年,Aww推出日本第一个虚拟数字人imma在Instagram走红,其头部由3DCG制作,与实拍的身体和背景图片进行合成。另外,Imma还有几位兄弟姐妹,Ria、Zinn、plusticboy、Asu、Ella几位虚拟人也都是出自Aww公司。”

当前imma主要活跃于时尚、公益等领域,截止23年5月24日,账号已拥有40万粉丝。她与保时捷、宜家、迪奥等多家品牌达成广告和代言合作,拍摄各国时尚杂志封面,偶尔分享生活日常,与真人网红无二。2021年3月,Aww公司宣布和东南亚与日本企业桥梁公司value合作,利用虚拟数字人不受时空限制的特点,让imma参与了柬埔寨某村庄女性支援活动。imma因此获得日本内阁府设立的“Cool Japan Matching Award 2021”鼓励奖。

MASTER MODEL引擎集合了虚拟数字人制作所需基础技术,创造出各类模拟真实材质的虚拟数字时装,与3DCG技术融合,成为时尚界服装展示的新选择。2020年,Aww使用MASTER MODEL为日本迪士尼制作虚拟数字人Ella,目前已经登入Instagram并进行日常更新。

加码AI、XR技术:2020年Aww将全部投入技术研究开发,虚拟数字人制作业务基础上,瞄准实时3D CG制作和数字时尚等新领域。继续加码对新兴技术的开发与投入,通过AI技术让旗下vHuman拥有智慧的灵魂与专属的声音,并通过XR技术达成类现实场景下的多场景互动。

Synthesia:利用AIGC技术打造虚拟数字人视频平台

Synthesia是一家利用AIGC技术合成虚拟数字人视频的英国公司。2023年4月,福布斯发布AI 50榜单,Synthesia被评为最有前途的人工智能公司之一。Synthesia公司自成立以来已经为客户制作了超过100万部视频,最知名的案例是为乐事薯片制作了以梅西形象为主角的视频,用户做出不同的消息选择,会接受到来自梅西发出的个性化比赛观看邀请。

公司专注于合成视频创作,同时布局虚拟人领域。Synthesia官方定位是快速利用文本创建视频的AI视频创作平台,用户输入简单的文字,就能创建出逼真的虚拟人物视频。客户可以从人工智能生成的演示者库中进行选择,或者通过上传自己录制和剪辑的视频来创建自己的演示者。Synthesia利用其AI技术来分析上传视频或公司演员目录中的外观和声音,用机器学习技术解构音频和视觉元素,生成一个逼真的头像,可以很好地模仿人类。公司只需要简单的三步:选模版—选人物形象—输入文本,稍等片刻即可获得一个完整的视频,用户基本没有额外学习成本,操作简单无需掌握代码技能。

Epic Games:虚拟引擎加速虚拟数字人多领域应用

Epic Games是美国电子游戏与软件开发的龙头公司,业务涵盖跨平台游戏引擎技术、游戏开发。Epic Games有名产品包括虚幻引擎(Unreal Engine)、游戏《无尽之剑》与《堡垒之夜》等。

公司旗下引擎平台Unreal Engine发布MHC,轻松制作高保真虚拟数字人。MHC(MetaHuman Creator)是一款用于创建和设计虚拟角色的应用程序。在一般的虚拟真人创作中,创作者往往需要先进行细微数据采集后,再生成人物模型。但在MHC中,创作者可以先跳过数据采集这一繁琐且昂贵的步骤,在一个丰富的素材库中选取例如发型、面部、肤色等预设,来制作和生成想要的数字人模型,任何使用者都可以通过组合几十种人物特征进行创作,比如发型、耳朵模样、胡须和嘴唇形状,可以对其随意添加、删减和调整。MHC可以让整个虚拟真人创作过程大量简化,在提升速度和可拓展性的同时还保证了作品的质量。

构建虚拟人框架,借助引擎技术赋能游戏、动画等领域。MetaHuman拥有完整的框架,可以让创作者在能想象到的多领域用上极其逼真的人类角色。MHC可以与现代动作捕捉和动画技术结合使用,以创建逼真的动作,为视频游戏、电影、电视和其他制式的人机交互场景服务,它不仅可以辅助视频游戏角色创建,还能用于实时动画制作。例如《爱,死亡和机器人》第三季剧集《隧道墓穴》就是使用虚幻引擎和虚拟人技术来制作的。

Soul Machines:虚拟人底层技术优势助力企业营销

Soul Machines是新西兰一家专注于虚拟数字人研发和服务的人工智能公司,通过AI和计算机视觉开发具有智能和情感反应的头像模拟技术,使得AI交互更加直观自然。Soul Machines为聊天机器人或AI助手打造了逼真的虚拟形象,并将这些虚拟人输送到世界各地。Soul Machines的联合创始人Mark Sagar曾从事《阿凡达》、《金刚》以及《蜘蛛侠》的面部设计工作并凭借这些作品两度获得奥斯卡金像奖。

为企业定制在线虚拟人,提高品牌营销转化率。2019年,Soul Machines与全球知名护肤品品牌宝洁公司的SK-II品牌宣布了全球第一个自主动画虚拟数字人Yumi。Yumi的角色类似线上品牌大使,以拟人化的形象为客户提供护肤建议和品牌相关的对话反馈。据Soul Machines官网,Yumi上线使相关产品的各项客户满意度指标均出现大幅增长:客户净推荐值提高了90%以上,与Yumi互动后,消费者购买的可能性增加了一倍;客户转化率提高了4.6倍;客户满意度也提高了2.3%。

目前,Soul Machines已在教育、娱乐、金融服务、卫生保健、公共部门、房地产、零售和电子商务、科技与媒体、电信和呼叫中心等多个领域均有优秀的案例,奔驰、索尼、谷歌亚马逊微软宝洁等知名企业也纷纷与Soul Machines合作,探索虚拟人在自身领域的应用。

把握行业发展机遇,国内数字虚拟人+AI公司乘风破浪

新华网:开创新闻领域AI应用先河,成立数字人实验室

新华网是新华社控股的传媒文化上市公司,依托新华社作为国家通讯社的权威地位和作为世界性通讯社的全球信息网络,新华网拥有权威的内容资源、广泛的用户基础、优质的客户资源和强大的品牌影响力,并以此为基础开展网络广告、信息服务、移动互联网、网络技术服务和数字内容等主营业务。在数字内容方面,公司利用人工智能、虚拟现实、增强现实、混合现实、创意数字影视、创意艺术视觉、无人机等现代数字技术,瞄准视频化、移动化、知识化、智能化方向进行融合形态数字内容的创意、策划、设计、开发、制作和跨平台销售。

数字虚拟应用落地,助力“数字人”自由。2021年,新华社与国家航天局等单位联合打造了专门面向航天主题和场景的数字记者,该数字记者采用全新的制作管线和实时渲染技术,使虚拟数字人物更加生动形象,并可担负太空报道、火星登陆等真人不能或很难完成的任务。2022年,新华网成立数字人实验室,继续深化人工智能技术应用探索,打造了虚拟数字人“筱竹”。同时,由新华网和阿里巴巴合资成立的数字文化企业新华智云,2019年便试水数字人,开创了新闻领域实时音频与AI真人形象合成的先河。2020年的地方两会报道中,有7省的两会报道使用新华智云虚拟主播。据新华网,截至2023年2月,超过500家媒体、政府机构、金融机构、会议会展企业使用新华智云虚拟主播。

硅基智能:率先布局国内AI虚拟数字人,迎来规模商业化

硅基智能作为率先布局人工智能独角兽企业、AIGC赛道视频、直播内容生成领域的先行者,一直致力于人工智能、数字人应用赋能实体升级发展。公司是国内首个入驻抖音群峰服务市场的数字人产品公司、腾讯唯一重点投资的AIGC数字人企业以及华为云平台生态合作伙伴,业务包括电话机器人、智能客服、屏数字人、同屏数字人、VPPT数字人、直播数字人和克隆人等虚拟数字人等。公司将“碳基生命的硅基化"作为核心目标,专注于AI技术深度研发和落地应用,通过自主研发的人工智能核心技术,向社会源源不断地输出硅基劳动力。一直致力知识生产、传播智能化、服务智能化、生产要素虚拟化,以数字人应用赋能实体企业数字化升级发展。

AIGC技术和超级算力形成驱动,全应用场景得以覆盖。硅基智能有独特的AIGC数字人解决方案,以AIGC技术为核心,搭载人物形象模拟、智能语音交互、NLP(自然语言处理)、无穿戴表情动作捕捉等技术,可以快速创造出外表接近真人,智力接近真人的AI数字人。在“硅基DUIX引擎+华为鲲鹏引擎”的超级算力双向加持下,为高性能计算、数据库、云计算负载进行高效加速,创造仿真人形象和声音的数字劳动力。其主要运用三大平台:DAAS(数字孪生应用平台)、MAAS(沉浸式元宇宙体验平台)、DUIX(数字人交互平台),包含语音识别、人像驱动、视频通信、语音交互等算法技术,从而实现了数字人的“能听、能说、可互动”,并覆盖微信、短视频、大屏等应用场景。

公司持续输出硅基劳动力,AI虚拟人迎来规模商业化。硅基虚拟数字人已广泛应用于视频生产、虚拟直播、数字文娱、本地生活、教育医疗、乡村振兴、金融保险等领域,数字主播、明星分身、培训教师、数字演员、数字律师……越来越多的硅基数字人正在“持续上岗”。公司业务已遍布全球,积累了数十个行业近上万家企业用户,生产了近150万个数字人,与30万余家商家、4万余个电商带货直播间、上万名百万粉丝大V达成合作。公司未来预计5年内为全球输出1亿硅基劳动力,并在数字化IP运营能力、私域流量管理能力、知识生产传播能力三方面为全球客户赋能。

中科深智:自研多模态驱动技术,全方位实现降本增效

公司定位于生成式AI虚拟人和3D AIGC技术领导者。公司认为在元宇宙中,不同场景需要不同的驱动技术,很难有某种单一动作和表情驱动技术能满足所有虚拟人动作和表情驱动问题。因此,中科深智打造了Motionverse多模态动作生成驱动引擎,该引擎融合了XR和AI技术,可以用传感器、语音、视频等多种方式让虚拟人动起来,随时与用户互动。

据公司公众号,截至2023年2月,中科深智在我国电商虚拟人领域市占率超过70%。中科深智基于自研的CLAP大模型算法和Motionverse业务中台,打造了能够满足众多电商卖家需求的虚拟直播工具百宝箱——自动播,可支持电商平台3D虚拟人主播、虚拟直播间、虚拟人客服、虚拟人直播助理等可视化RPA功能。同时,在生成式AI这波浪潮中,中科深智汇集超写实虚拟人生成系统AnyHuman、自研3D AIGC系列产品AI快速动画生成系统-自动画、高效的虚拟人实时交互和应答系统-云小七等,并将打造不同场景下的AI工具集,为包括电商场景在内的行业场景提供一站式的解决方案,全方位实现降本增效。

2023年5月10日,公司正式宣布大语言模型GenSense“数智姜尚”上线,这是一款专为企业私有化部署和数字人设计的大语言模型,将提供全流程、端到端的实时3D虚拟人服务。据公司介绍,这是国内商用大模型的首次私有化部署,数智姜尚具备轻量级、可私有化部署等特点,除了适用于虚拟直播、数字员工等场景以外,还可进一步用于金融、医疗、政企等专业领域。

相芯科技:深耕消费级赛道,自研“虚拟数字人引擎”和“超写实数字物平台”

相芯科技是一家提供虚拟数字人建模、动画、交互、渲染全栈能力,高效打造全品类虚拟数字人的公司。自2016年成立以来,相芯科技自研了弱输入智能建模、全要素角色动画、轻量化实时渲染、多模态自然交互四大算法模块,同时,进一步结合AI技术,满足虚拟数字人精细化、智能化和多样化的趋势,既有强调人格特质的虚拟化身、虚拟偶像,也有强调功能属性的数字员工、虚拟客服、虚拟主播等,提升虚拟数字人生产力。

相芯科技自主研发“虚拟数字人引擎”和“超写实数字物平台”,专注于计算机图形学和人工智能技术的深度融合。公司推动XR技术创新和产业应用,持续实现技术突破,截止目前,基于两大技术平台,相芯科技已服务汽车、手机、金融、互娱、电商、政务等各个领域逾千家国内外企业,获得了客户的一致好评。公司的虚拟数字人技术已被应用到多个行业,延伸出了AvatarX智能虚拟数字人平台、智能汽车行业解决方案、金融行业解决方案等一系列架构,可提供全栈式虚拟数字人解决方案,助力不同企业完成转型升级。

相芯科技持续深耕消费级虚拟数字人,结合AI技术全领域赋能。公司研发的“碰爪”是一款主打虚拟化身和多人视频聊天的话题社交应用,为用户打造一个以自己为模型的虚拟化身,互相连线聊天的APP,能会实时同步用户的表情。在虚拟人创建与互动的场景上,相芯科技以自主研发的AvatarX平台,通过虚拟形象生成、虚拟形象DIY、虚拟形象驱动等在内的一整套数字人技术,帮助碰爪搭建起与Z时代沟通的第一座桥梁。“江南01号数字员工”是公司研发的交互式远程虚拟柜员,不仅可以完成咨询、播报、迎宾这类基础工作,也可以帮助客户完成密码挂失、重置、签约等复杂业务办理,是行业首个可办理银行业务的“虚拟数字人”。“江南01号数字员工”可以提供随时随地,无感且无处不在的7*24小时全天候“一对一”服务,突破“营业时间”与“营业网点”的限制,提高服务的准确性和稳定性。

风险提示

1) AI技术风险。AI发展迅速,也会产生相应的风险,如果国家对AI使用作出限制,可能导致技术运用无法落地。

2) 商业化落地不及预期。AI+虚拟数字人的商业化落地受算力、算法、数据、场景、用户等多因素共同影响,若商业化落地不及预期,可能导致相关公司收入增长不及预期。

3) 本报告基于公开客观信息整理,不代表提及公司的覆盖与推荐。

文章来源:华泰证券

$上证指数ETF(SH510210)$ 

$1000ETF(SZ159629)$