百度输入法每天语音被调度3.35亿次!又一个AI赋能的样板

发布于: 雪球转发:12回复:44喜欢:6

8月1日,$百度(BIDU)$ 百度发布了2018年二季度财报。财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%。当然,作为公司核心战略,AI依然是百度财报最高频出现的元素。不论是成为收入增长新驱动的信息流业务,还是给百度编织未来的DuerOS和Apollo,均与AI直接相关。

除此之外,在财报中被重点提及的应用还有两个,一个是百度旗舰应用百度App,6月日活达到1.48亿,同比增长17%,日均用户使用时长同比增加30%,信息流取得成功;另一个则是输入法,李彦宏在发布财报时透露,依托“百度大脑”的进化,百度输入法语音输入请求量短短一年时间内成长到日均3.35亿次。

为何输入法被突出?

看到输入法日均语音请求3.35亿次这个数据,我还是感觉到有些意外的。第一个是输入法只是百度众多应用的一款,不是百度App这样的旗舰应用,会在发布财报时被李彦宏重点提及,让人意外。第二个是百度输入法的数据确实很可观,前一天发布财报的$搜狗(SOGO)$ 搜狗旗下的搜狗输入法,日均语音输入请求量才3亿次,而搜狗输入法是中国输入法的老大,其日活跃用户数达到3.8亿,百度输入法语音请求次数竟然超过了搜狗输入法,这也让人意外。

相对于搜索引擎、信息流等超级市场而言,输入法市场对于百度来说,曾经不是那么重要,更多是防御性业务。输入法是用户与机器之间人机交互的一个重要桥梁,负责信息的录入,此前搜狗输入法拥有绝对优势,并且从输入法切入到浏览器再进入到搜索市场。百度反其道而行之,在搜索市场拥有绝对优势后,推出了浏览器和输入法等工具,避免被人掐住脖子。

百度出发点可能是防御,但这并不阻碍百度将输入法做好。熟悉输入法发展历史的都知道,搜狗输入法可以在微软等巨头均有输入法时脱颖而出,正是因为与搜索大数据结合,进而给用户更加精准的候选词条和句子,大幅提升了搜索效率,搜索成了输入法的幕后功臣。因此,作为最大中文搜索引擎的百度,做起输入法自然是得心应手,事实上,百度输入法推出以后就成为主流输入法应用。

到了AI时代,输入法对于百度的重要性正日益凸显。从财报可以看到,百度对输入法的重视正在升级。百度越来越重视输入法应用,在我看来原因有几个:

第一,输入法特别是语音输入法,是AI的典型应用,百度AI技术特别是语音技术和自然语言处理技术,通过输入法实现了规模化的应用;

第二,语音输入法可以帮助百度获取更多语料数据,进而可以反哺算法实现语音技术甚至百度大脑的进化;

第三,长期来看,语音输入法给语音助理等应用提供了基础,用户如果习惯用语音输入文字,就会习惯用语音来与机器交互,发号施令,而语音助理也是百度布局的重点,最核心的业务是DuerOS,百度二季度财报显示,DuerOS 6月的语音唤醒次数达到了4亿。

百度输入法语音输入崛起之道

从文字输入到语音输入甚至图片输入,输入法的技术门槛正变得越来越高,AI技术已成为其核心驱动,正是因为这样的变化,给了百度输入法崛起又一个机会。与此同时,智能语音输入技术的成熟,用户越来越习惯语音交互,也让语音输入法逐步兴起,当然,语音输入的兴起,与智能语音助理、智能音箱等等应用的兴起也有间接关系。

7月,赛诺(SINO-MR)对外发布的《2018上半年中国手机输入法分析报告》显示,在手机输入上,语音输入正在越来越重要,拼音和手写输入法则有下滑趋势,“得益于1分钟输入400字,提升用户对语音输入效率的感知,语音输入占比从去年下半年的38%提升至今年上半年的41%,使用占比稳步提升。”人工智能的应用,将大幅提升输入法的语音输入效率。

语音输入兴起,同时十分依赖AI技术。百度抓住这样的趋势,基于领先的AI技术在语音输入上进行布局,如今实现了厚积薄发。

百度在AI上的战略布局,在深度学习上的技术积累,已无须赘述。回到输入法上,这款应用本身也是百度AI驱动的一个典型产品,李彦宏在谈到语音输入法的成绩时,也提到这是基于百度大脑的进化而实现。

具体来说,百度输入法搭载了百度第二代深度尖峰技术(Deep Peak 2),极大提升了用户的语音输入体验。Deep Peak 2模型,即基于LSTM和CTC的上下文无关音素组合建模。与传统语音技术的建模方式相比,它能够充分发挥神经网络模型的参数优势,大幅提升百度输入法对中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,目前,百度输入法语音输入相对正确率较行业领先水平提升20%,能够更精准地识别用户的自然对话。

除了准确外,百度输入法还将用户输入场景做细,针对性进行优化,进而提高输入效率和用户体验,比如它推出了语音速记、轻声识别和极简语音等多种功能,其中轻声识别是满足用户在公共场合的输入,尽量减少对他人的干扰的同时,实现准确的输入。

AI技术的积累,特别是语义技术的积累,确保百度输入法在面对不同语言、方言、口音和风格的语音输入时,均可十分准确;产品细节的优化,特别是针对不同场景的功能优化,让百度输入法效率更高、体验更好,有第三方报告显示,准确率和效率,是影响用户选择一款输入法的关键点,这样看来,百度输入法语音输入快速爆发式增长就不让人意外。

输入法是百度AI赋能的新样本

在上个月举行的开发者大会上,百度旗下AI基础技术开放的核心平台“百度大脑”升级到了3.0,拥有多模态语义理解能力,可供开放的AI能力超过了110种,此外还提供了EasyDL,AutoDL和AI Studio等系列开发工具包,推动深度学习框架PaddlePaddle的应用,百度甚至还发布了自主研发的“昆仑”系列AI芯片。种种举措都表明,百度正在构建AI全栈技术的基础设施,且毫无保留地将其开放出来。

将AI技术开放出来给更多行业,更多应用,更多场景,获取更多用户数据和使用反馈,进而反哺算法进化形成正循环,就可以让百度AI立于不败之地,这个思路一直贯穿在百度的AI基础技术,以及垂直应用如DuerOS和Apollo平台中,百度将这个理念提炼为要让“Everyone CanAI”。

当然,百度在将AI开放给外界的同时,自然首先会让自有业务“吃上”AI,不论是搜索,地图,金融,娱乐、商业还是旗下App,几乎都已受益于AI,百度输入法靠语音输入功能弯道超车,也是一个AI赋能传统应用的案例。输入法的历史跟互联网一样远,百度输入法1.0早在2010年就已推出,如今依托百度大脑背后的AI技术,正在焕发出新的活力,甚至有机会成为语音输入法的NO.1。

而且向后看,百度语音输入法也可以进一步将用户导入到类似于智能助理、智能翻译、智能教育等等语音驱动的应用,毕竟,用户习惯通过语音跟手机对话后,就有更多应用诞生的可能。

在我看来百度输入法的成功也是可以复制的。通过AI基础能力来赋能传统经典应用,让其具备更好的体验,这一套模式,已经、正在和还将被复制到更多应用场景中,比如搜索引擎、浏览器、电商购物、视频等等App都在受益于AI技术的进化,它们都需要百度大脑这样的AI基础技术平台的支持。当更多应用认识到这样的趋势后,就可能会成为百度大脑的开发者,调用百度的语音以及AI服务,进而复制百度输入法的成功,我想这才是李彦宏在发布财报时强调输入法的深层涵义。

@徒步三萬里V @今日话题 

精彩讨论

龚虹嘉入局2018-08-01 18:14

讯飞输入法,比百度输入法,更精确,更准确。

全部讨论

2018-08-01 21:43

这不是对着讯飞打吗?不过百度吹牛水平一流。

2018-08-01 18:54

百度输入法还有讯飞语音哪个更好用呢?嗯,这句话输入的还不错

2018-08-01 18:27

我也用语音发一个试一试看怎么样

2018-08-01 18:14

准确率如果接近,百度的流量比搜狗大很多,马太效应,选择百度远大于搜狗。