小鹏P7上新,全新AI语音有情绪有速度有顿挫更像真人

发布于: 雪球转发:0回复:0喜欢:0

关注并标星电动星球News

每天打卡阅读

更深刻理解汽车产业变革

————————

出品:电动星球 News

语音,已经被视为智能座舱最主要的交互方式。但即使是「林志玲」、「郭德纲」等语音套件,合成音依然有一种机械感。今天下午,小鹏汽车宣布 P7 将上线全新的 AI 声音,核心卖点就是「更像真人」,并为此举办一次线上的说明会。

网页链接

真的这样吗?来,先听一下小鹏官方放出的声音对比视频。

怎么样?是否感觉的确存在「代差」。一个有明显的机械感,一个几乎与真人声音无差别,有语调有变速有顿挫。

小鹏官方的说法是,智能语音助手小P即将通过OTA获得一款全新AI声音。新声音采用了「全新一代超大规模在线神经网络引擎+小型离线拼接引擎」的技术组合,更好听、更生动,带来更接近真人的车载语音交互。

根据国际通用语音质量评测方法MOS评测,在满分5分情况下,小P全新AI声音得分高达4.49分,是目前微软MOS语音质量评测得分最高的车载智能语音助手。

但这依然是有疑问的。譬如,使用了「在线神经网络引擎」,在网络条件不好时,会否出现卡顿?如果会,整体表现会否还不如离线的语音引擎?

在 Workshop 上,小鹏的技术专家给了我们解释。

他表示,新声音的确需要在线才会生产最好的音质,但如果在网络不好的环境下,新声音的质量也不变差。

小鹏花了大量的时间和精力做了一整套的策略,包括本地加强能力,做到了 97% 以上场景都会是在线引擎,几乎不会让用户感受到降级,也就是机械声音。

此外,全新的在线神经网络引擎,又是否意味着能做到更好的个性化?譬如,口音的个性化识别?

「新声音是语音合成方面的新功能,你所提到的个性化,其实在大 AI 策略中都有。」小鹏专家表示,口音的个性化其实要归类到语音识别的领域,这一块小鹏其实都在做。

小鹏官方表示,全新AI声音采用了24K采样技术,实现了高保真音质,并拥有包括助理、聊天、客服、愉快、温和、亲热、抒情、新闻、严肃、不满、生气、害怕、悲伤、冷静等14种强烈情绪的变换能力,声音细腻动听,生动自然,有真人般的气息顿挫,能表达更多情绪,几乎与真人无异。

在此前的评测中,我们曾说小鹏的「全场景语音功能」是当下最好智能交互助手,这次全新 AI 声音的进化,又会否让所有人再次感到惊艳?

全新AI声音预计将于7月通过整车OTA首先搭载在小鹏P7上,并适用于小鹏P7全系车型。

(完)

最后,来看看我们的微信小视频,转发关注评论一键三连