太逼真!全球首个俄语AI合成主播在俄罗斯上岗,原来是中国制造

发布于: 雪球转发:0回复:0喜欢:0

熊猫外交

可能是全球歪果仁民都乐意夹道欢迎的

一项“中国专利租借输出”

据史料记载

从武则天向日本天武天皇赠送“白熊”(即熊猫)算起

“萌即正义“的熊猫外交

已有1334年悠久历史

6月5日

大熊猫“如意”和“丁丁”

正式在俄罗斯莫斯科动物园大熊猫馆亮相

但你们以为战斗民族们只收到了这一重惊喜?

第二天

第23届圣彼得堡国际经济论坛上

中国新华社、俄罗斯塔斯社和中国搜狗公司

联合推出了全球首个俄语AI合成主播


小wifi大胆判断

AI合成主播可能是继熊猫外交后

国人找到的新型交友黑科技

从此,我们与战斗民族之间的友谊

又多了一层AI笼罩的神秘感

究竟是怎么回事儿?

且待下文分解

握手顶级媒体,中国AI跨出国门

相信有不少人对搜狗的印象还停留在搜索引擎或者是输入法上,但是其实它已经悄悄地打入了媒体圈,做起了主播界的“网红”。

前两天,搜狗就联合新华社、俄罗斯塔斯社推出了全球首个俄语AI合成主播,先跟着小wifi来看一段俄语播报。


俄语听不懂没关系,单看表情和唇形,小wifi就认定这主播足以“以假乱真”了。

这位虚拟主播的形象可不是“空穴来风”,她的原型是塔斯社关系部首席专家伊丽莎白·泽连斯卡娅。在看过了自己的“克隆版”主持后,伊丽莎白·泽连斯卡娅说:“非常像,可以从旁观角度看自己,非常神奇。”


此次与搜狗合作的塔斯社,来头不小。作为俄罗斯的国家通讯社,塔斯社也是全球五大通讯社之一,对外向115个国家和地区提供新闻信息。在未来,AI合成主播将被应用于塔斯社的新闻报道中。

当然了,这不是搜狗AI合成主播第一次走出国门,更不是搜狗第一次与世界顶级媒体合作。

今年5月,搜狗与阿布扎比媒体集团达成合作,双方将联合推出全球首个阿拉伯语AI合成主播。“中国造”人工智能正在走向全球。

时钟再往前拨到2018年11月的世界互联网大会上,搜狗与新华社联合发布了全球首个AI合成新闻主播——“新小浩”。

“新小浩”的原型是真人主播邱浩,与其相似度高达 99.9%。今年二月,这位AI合成主播已经成功成为“站立主播”。

站立式“新小浩”,不仅能坐着播报新闻,还能站起来,带着各种有范儿的手势,以专业主持人的姿态播报新闻。

并且,“新小浩”的同事“新小萌”也被搜狗AIcue到了。

如今,入职短短半年时间,新华社的这两位AI合成主播就已生产了5100多条新闻报道,累计时长达13000多分钟。

藏在AI主播背后的黑科技

这些AI合成主播“以假乱真”的程度让小wifi等吃瓜观众难以分辨。那么,这些宛如克隆出来的AI合成主播们,到底是怎么制作出来的呢?


说到这里,就不得不提到搜狗AI的当家黑科技——“搜狗分身”了。

作为目前全球首个能真正实现AI真人影像模型构建的人工智能技术,“搜狗分身”诞生于搜狗“自然交互+知识计算”这一人工智能理念之下。

“搜狗分身”不仅是搜狗人工智能的核心技术之一,也是AI合成主播的基础。


搜狗的分身技术由两大引擎组成,分别是语音合成引擎和形象合成引擎。

语音合成引擎负责将输入的文本转换为对应的语音,形象合成引擎则负责让AI分身带有动作,有感情地讲述输入的文本。

在它俩强强联手后,再利用录制的音视频数据来进行建模。

实际上,最近几年,围绕着“自然交互+知识计算”的战略核心,搜狗一直专注于人工智能领域的探索。

搜狗蓝图中的“未来语音交互”,绝不只是干枯的声音信号传递,而是力求通过与图像、视频等多种媒体形式的结合,为人机交互注入更为鲜活的质感。

比如,在这次俄语AI合成主播身上,搜狗使用了在音视频合成上取得的新技术突破。


搜狗最新的图像的生成能力,在已有的表情+唇形生成技术基础上,又添加了微表情能力的建模。同时,基于海量大数据学习得到的超深度神经网络,能够预测更丰富的头部姿态,这样你们就能够看到一个拥有细致生动的表情细节,整体形象更逼真自然的AI合成主播啦。


走向世界的搜狗未来将以分身技术为突破口,驶入AI落地应用化快车道。

AI合成主播走进媒体,其实它所发挥的作用,远不只减轻新闻工作者的工作量,让他们从繁琐的重复劳动中解脱出来那么简单。小wifi觉得,或许它更应该被看做是媒体行业利用技术,进行的一场自我迭新。


当然,作为一种新型技术,AI赋能媒介只是它若干分支中的一支。

我们可以预见,行走在风口上的搜狗分身技术,未来必将被引入到更多行业的建设中。比如,娱乐、医疗、教育、金融等多个领域,或许都能得到它的鼎力相助。

反之,分身技术也将顺应不同行业走向,得到长足发展。

因为科技进步,一个AI新世界的大幕正在徐徐拉开。

本文作者:鸭肉 小野

编辑:小野

图片制作:胖丁