讯飞轮值总裁胡郁：大数据是人工智能产业落地的必要保障| BDTC 2019 加入「公开课」交流群，获取更多学习资料、课程及热招岗位等信息整理 | 夕颜出品

加入「公开课」交流群，获取更多学习资料、课程及热招岗位等信息

整理 | 夕颜

出品 | AI科技大本营（ID:rgznai100）

【导读】12 月 5-7 日，由中国计算机学会主办，CCF 大数据专家委员会承办，CSDN、中科天玑协办的中国大数据技术大会（BDTC 2019）在北京长城饭店隆重举行。

100+ 顶尖技术专家、1000+ 大数据从业者齐聚于此，以“大数据驱动智能+”为主题，聚焦智能时代大数据技术的发展曲线，围绕大数据与社会各行业相结合的最新实践，进行了深度解读和讨论。

在主论坛上，科大讯飞联合创始人、轮值总裁胡郁发表了题为《人工智能从技术到产业发展路径》的演讲。

胡郁是中国科学技术大学信号与信息处理专业工学博士，教授级高工；国务院特殊津贴专家；科技部新一代人工智能战略咨询委员会委员；科技部863类人智能重点项目首席专家；语音及语言信息处理国家工程实验室执行主任；中科院人工智能产学研创新联盟应用规划组组长；中国科学技术大学兼职教授、博士生导师；中国人工智能学会副理事长，会士；中文信息学会的常务理事；湖畔大学二期学员。

演讲核心观点：在当前人工智能技术发展进展下，深度神经网络结合大数据成为技术和产业发展的必然路径，发展过程中需要结合产品创新和商业模式创新来获取真实的应用数据，同时实现人工智能应用落地，并将应用得到的商业回报继续投入到核心技术研究中，实现产业和技术互相迭代、同步发展的涟漪效应。

以下内容为演讲实录，由 AI 科技大本营（ID:rgznai100）整理：

很高兴来到 BDTC，今天讲讲《人工智能从技术到产业发展路径》，特别是人工智能和大数据结合的最新进展。

人工智能不断进化

人工智能在过去几年中非常火热，但凡是跟人工智能沾点光的都会说自己是做人工智能的，就像前几年大家都说自己是做云计算的、做互联网的、做大数据的一样。

但是在过去几年当中，我们一直提出来要对人工智能进行明确的分类，大家都知道世界上第一台计算机被发明的目的是做人类不擅长做或者做得不好的方面，比如运算，计算机的特点是算得快、存得多，第一台计算机的使命是为了分析炮弹在空中飞行的轨迹这样复杂的问题，直到 2017、2018 年，炒得非常热的 AlphaGo 战胜李世石九段等，在利用人工智能的方法方面并没有太大的突破，都是利用人工智能的运算能力。

但是为什么人类和动物不擅长运算智能呢？因为人类祖先在非洲大草原上要生存不需要计数，但是他们一定要眼观六路，耳听八方，一定要知道如何捕猎和逃跑。Nature 上有篇文章专门研究了动物捕食者和被捕食者的感知到运动的神经回路，发现它们是一样的。人和动物当年在非洲大草原上竞争，需要的是感知智能和运动智能。

机器在这方面的发展很快，感知智能这两年在语言和图像上不断实现突破，运动智能是向工业机器人和服务机器人方向大力发展。那么这些方面是否就是人工智能发展的最高目标？其实不是的。人类区别动物的一个重要方向就是人类有认知智能，我们首次把认知智能方向提出来，很高兴现在很多研究团体也把感知智能和认知智能作为将来主要的研究方向。

人类的认知革命

为什么讲认知智能是计算机的研究方向？我们看个小故事，非常火的以色列年轻历史学家 Yuval Noah Harari 写了《人类简史》这本书，提出人类历史经历了农业革命、工业革命、科学革命和技术革命，但是人类之所以区别于动物，其实是非常重要的基因上的突变。他发现，地球上原来的猿人有很多种，其中我们人类所有的祖先都属于非洲的智人后代，而其他猿人都逐步被走出非洲的智人打败，从此销声匿迹了。为什么走出非洲的智人有这么大的能力？所有猿人都会用火、用工具，但是非洲的猿人有什么特点？

研究表明，非洲猿人最大的特点是经历了基因突变，他们大脑的颞叶转化了一个小的组织，这个组织产生了语言，而正是因为语言的使用，非洲的智人可以非常好地描述周围环境，特别是人类与生而来非常擅长的一个能力，叫做“八卦”，因为八卦，人类社会得以建立，因为八卦，我们研究了可以组织成更多的群众。大家可以想象一下，现在的类人动物，比如大猩猩，一个群族只能有 50 头，超过就要分家，没有语言无法很好组织更大的社会活动。

另外一个非常重要的优势是有了语言以后人类就有了梦想，人类可以创造宗教、创造经济，所以他们也把这种革命叫做“人类的认知革命”，而计算机实现认知革命还有非常远的距离。

认知智能包括：语言理解、知识表达、逻辑推理、最终复杂决策，认知智能是现在人工智能的最大挑战，自然语言处理作为认知智能的第一步得到非常多国际上大佬的关注和支持，但同时也是现在人工智能突破的一个拦路虎。

人工智能的实现路径

深度神经网络

按研究方向和方式分类，我认为人工智能主要分为三大类：第一种，是现在大家大说特说的深度神经网络，深度神经网络利用大数据、超级计算能力和非常复杂的模型结构，第一次实现了感知智能、运动智能的部分进展，特别是在感知智能方面取得的突破尤其大。

但是这里有一个小小的问题，大家有没有思考过这些数据从哪里来的？利用感知智能和大数据智能的方法实现人工智能，需要大量真实的大数据，这点和人类的学习是完全不一样的，人类的学习是小样本学习，不需要太多大数据，特别是在语音和图像上面。

全脑模拟

第二种人工智能实现路径，是由美国欧洲提出的“脑计划”，这些提出者有一个想法，随着超级计算机的进一步发展，对人脑理解更加深入，是否有可能像超级计算机模拟核爆炸全球气象一样模拟人类大脑中的所有拓扑结构和放电现象？因为人类大脑也就 1 千亿个神经元而已，最新报道已经有人把果蝇甚至小白鼠神经系统完全还原出来，某天计算机如果完全可以模拟所有大脑的放电情况，我们是否就得了一个智能？这个方向是脑科学的科学家提出来的，且不讲这个方向是否能实现，但是得到这样的系统似乎并不是我们现在利用电子计算机的方向。

智能动力学

第三种方案是我们正在做的。我们希望就像人类研究鸟类飞行一样，最后人类研究出“空气动力学”，造出比鸟更好的飞机，它不用像鸟一样吃喝拉撒，但比鸟还快，因为飞机遵循鸟类羽毛空气动力学的基础理论。

随着我们对人类大脑理解越来越深入，对人类大脑拓扑结构和学习机制理解更深，我们完全有可能发明一种“智能动力学”的东西，它可以在学习人脑的学习机理、人脑结构后，与计算机的速度快、存得多的特点完美结合在一起，产生强人工智能甚至超人工智能的可能性，这是我们的研究方向，后面讲的很多产业应用是建立在大数据人工智能基础上的。

涟漪效应推动A.I.从技术向产业发展

从 2006 年推出深度学习网络以来，推动产业发展取得了很大的成功，但是有一个关键点决定我们在大数据人工智能中的成败。训练大数据人工智能需要很多真实的大数据，很多情况下真实的大数据只能来自于真实的应用中，那么问题来了：当你的人工智能训练还不够好的时候，从哪里得到真实的大数据？又有什么样的人去用它？这里我们提出一个非常重要的设想，并且把它实施了，取得了很好的效果，我们叫它“涟漪效应”。这是什么意思呢？

讯飞大数据能力总览

当人工智能算法给业界和大众使用时，算法并非一瞬间就扩展到所有人，总是有些人先接触，有些人后接触，这些先接触的人会持续地为人工智能的算法贡献数据，利用这些数据不断地提高人工智能系统的性能，总有一天就像水波纹在水面扩散一样，水波纹刚落下去时影响水面范围比较大，但是错误率比较多，随着系统越来越好，总有一个时刻水波纹还没扩散到水面时趋近于零，人工智能正确率已经达到非常高的高度，实现大量人员使用的保证，所以我们讲深度神经网络、大数据，将应用产品和人工智能结合在一起是非常重要的。

科大讯飞的大数据能力可以分为四个层面，首先是大数据资源，即我们通过各种产业和业务获得的真实应用数据，再往上是大数据能力平台，再往上是业务大数据，各个业务中，教育、医疗、政法、智慧城市里都有这样的大数据，最上面一层叫大数据业务，就是在广告与推荐、在征信等各个方面利用大数据，完全可以成为一种虚拟的业务来实行。

科大讯飞有一套 Odeon 平台，将大数据方面，包括数据的清洗、数据的挖掘、数据的标签系统，从收集、存储、计算、服务形成了闭环。在大数据人工智能基础上，2004 年推出了讯飞超脑计划，希望实现从“能听会说”到“能理解，会思考”的转变过程。

在新一轮基于神经网络的过程中，我们发现有两层放大器的效果，第一层，现在的人工智能不仅包括语音、图像、自然语言处理，它们都统一到一个框架上，就是深度神经网络，把深度神经网吃透了，这些核心技术会产生非常大的平台性提升。在这些核心技术基础上，我们又能与各个行业结合，包括消费者、教育、医疗、政法和智慧城市。

AI 产业发展的两大方向

将来人工智能会在哪两方面应用到人类社会中？我们把其中一个方面叫做“自然交互智能”，大家想象一个乞丐他不识字，但是他可以按照你的要求去办事，你给他 5 英镑，他可以帮你买一盒烟，他可以用视觉、听觉、嘴巴跟你交流。将来每个机器都有自然交互的能力。还有一个方面是文字发明以后产生很多专业，所以人工智能有一个应用领域是研究专业行业大数据和专家系统，专家系统可以帮助很多行业解决行业里最稀缺的资源问题，最稀缺的资源就是专家。

今天从 3 个案例分享科大讯飞大数据的应用方向：

应用案例一：

所听即所见，即“讯飞听见”系统。在涟漪效应助力下，从一开始语音识别不好用，到 2010年首次在手机上实现了语音识别的系统，经过 3-4 年的发展，成为世界上第一个中文能够突破实用技术的门槛。到了 2015 年，能够识别更多类型的语音并且上屏。

这中间使用了很多基于大数据的人工智能技术，比如麦克风阵列声学处理和语音处理融合的技术，引入基于图像处理的因素，并融合了更多专业性的算法、自然语言处理的知识。

在世界上最高水平的 CHiME 语音识别大赛上，讯飞包揽四项识别冠军。在各种各样的噪声干扰下，原来系统的识别率非常低，经过处理以后我们把识别率提高到百分之百。在涟漪效应的助力下，使用人数不断增加，错误率不断下降，真正由人产生的大数据帮助讯飞语音识别迈过了实用化的门槛。

最终，讯飞面向一系列消费者的产品落地，包括“听见”网站、手机 APP、录音笔、办公本、全球唯一一个全离线语音转文字系统。

应用案例二：

智学，是教育领域一个非常重要的应用点。教育领域利用人工智能的方法辅助教学是最近几年的热点，也是一个刚需。以教育为代表，医疗、安全、政务、金融，都需要利用产业的大数据、专家系统和机器学习深度神经网络算法来共同建立新一代的专家系统。

这中间应用到了图像识别技术，在图像领域，讯飞先后做了手写在线识别、离线识别，和针对自然环境下拍照内容的识别。在国际最高水平 ICPR MTWI 测试中，讯飞获得单字识别、版面分析、公式识别三项冠军。在顶会 ICDAR 2019 的多项评测中讯飞也获得冠军。

在教育中还需要用到自然语言处理的能力。在自然语言能力处理上有模拟人类大脑的神经元系统DNN，有模拟大脑的感觉性记忆和短时记忆 RNN-LITM，还有模拟人类大脑视觉分析层等算法。

讯飞获得的最新奖项是在 2018 年国际语义评测的数学问答竞赛中在代数、几何和应用领域获得第一名。国际上最高水平的 SQuAD 上，讯飞的机器阅读水平在两项评测标准中超过人类水平。

在全球首个医师资格考试中，讯飞利用理解机器人学习医院的教科书和知识，并应用在医学资格考试上。为什么能做医学资格考试？这要从 2013 年开始，国家科技部和 863 计划做一个高考机器人，希望这个高考机器人学习数学、语文、地理、历史的题目之后参加高考，并最终能够考上一本大学，考上清华北大。一开始大家都觉得这非常难，但是经过 5 年多不懈的努力，现在项目第一期已经结束，我是这个项目的 863 首席专家，最后机器人数学考了 120 分，语文考到90 分，地理和历史项目考到四五十分。利用认知能力，智医助理在满分 600 分的医学资格考试中获得 456分，而 360 分就及格了。

核心技术在教育领域会有什么用处？我们可以看到，它们可以让卷面批改完全实现自动化，先扫描试卷和学生答题内容，之后进行识别，根据识别的结果用人工智能的算法，结合原来老师评分的经验和知识，最后形成一个能够自动生成考试作业成绩的系统。

大数据教育的人工智能系统还能干什么？中国几千年的教育梦想是”因材施教”。现在，人工智能系统能够根据自动批改的结果，即后台大数据和知识图谱的知识点，来判断学生对哪些知识点掌握得不够，根据这些知识点再生成出需要的作业，而不是所有学生都是千篇一律的练习题。使用了这个系统以后，学生作业负担降低了 30%，学生的学习兴趣也得到了很大的提高。

在整个教育大数据中，现在讯飞围绕老师、家长和学生的需要，在教、学、考、评、管的很多方面推广人工智能和大数据的平台，相信再过几年，我们就会看到在中国越来越多的学生是通过个性化的、针对性的学习来提高能力，学生将摒弃题海作业战术，而是利用学生自身的差异来完成这个工作。我们相信，这样的机会一定能够改造教育的现状，并让中国有更好的未来。

AI+大数据是科技创新型公司的必然选择

综上所述，大数据和人工智能的结合是科技创新型公司必不可少的一条路径。我认为科大讯飞不是一家移动互联网公司，而是一家科技创新型公司，就像美国的 Facebook、亚马逊和 Google 一样，因为当你做核心技术时，要保证技术在全球最先进的，在过去 20 年当中，讯飞的很多技术，包括语音技术、人工智能技术都在国际上最高水平的比赛中获得了很好的成绩，有的更是突破了中文在全球的门槛。

第二条，作为一家企业，其必要条件是要能够找到合适的产品创新和商业模式创新，能够获得巨大的利润。

第三条，要把获得的利润持续不断投入到核心技术创新中去。

最后一条，讯飞原来做中文时是有优势的，因为语言保护了我们。现在随着国际形势的变化，我们被迫要去做全球所有的语言处理，现在我们已经走在这条道路上，相信再过 3-4 年就能够保证我们在全球的近 50 个语种中实现非常好的核心技术突破。

就像机械时代的航空发动机一样，人工智能是信息时代的航空发动机，我们有信心把人工智能做到最好。

在这个过程中，科大讯飞的人工智能和大数据业务会紧密结合，BDTC 发布的大数据趋势报告也显示，人工智能和大数据至少在现在以及将来的 10 年中将是紧密不可分的。

最后，相信讯飞一定能够取得更好的成绩，也能够更好地反哺讯飞在大数据方面的成果。

Q&A：

Q：从技术到引领消费者，您原来是管花钱的，后来是管挣钱，这个过程中技术肯定还是不能丢的，那么您是如何很好地把握角色的转换并坚持初心的？

A：我觉得有几个方面转换的因素。第一个，我发现做研究跟做产业有相似的地方，做研究有一个非常重要的能力，就是对前景预测的能力，要做什么领域的研究，这需要对这个领域将来的发展有非常透彻的了解且有自己的想法，这样才能跟上历史的步伐，而不是被它甩开。

做产业也是一样，当做一个具体的事情和方向时，首先最重要的是思考战略方向是不是对的，战略方向主要是来源于你对产业趋势预先的判定。就像我刚才提到的，我们为什么把人工智能分成感知智能、认知智能，为什么用大数据人工智能方法来做，为什么要提出我们的“智能动力学”，都是对将来很多事物发展、产业发展、产业规律发展做出洞察，同时要调整方向去应对。我觉得这是相同的部分。

第二，也有不同的地方，当我们做教育时，每个老师都希望自己发明一个技术有 1000 个地方都可以用，用得越多越好。但是做产业时会发现，不能因为你的技术能够用在 10 个方向，就把10个方向全做了，这是不行的。当你有一个技术时，除了要判断技术创新以外还是否有商业模式创新和产品创新的地方，还要用你自己的技术或者并不是你发明的技术，集中所有能量在最短时间能够突破的一个方向上，才能够实现我讲的技术创新的那四个步骤。这是不一样的地方。

最后一点，我认为做研究和做产业，特别是核心技术产业，有一点是都要做到的，就是要能够耐得住寂寞，要能够十年磨一剑，板凳能坐十年冷，要厚积薄发。因为这和互联网的风口、移动互联网的风口是不一样的概念，它像爬山一样，要慢慢积累知识不断前行，最后要成为浪潮本身，而不是冲浪型的企业。就像我们讲的，每次个人 PC 的浪潮中，那些真正成为浪潮本身的是什么？是芯片、是技术软件、是基础云计算的架构、大数据的架构。所以这两年一定要耐得住寂寞，埋头苦干，厚积薄发。

嘉宾简介：

胡郁，科大讯飞联合创始人，轮值总裁。中国科学技术大学信号与信息处理专业工学博士，教授级高工；国务院特殊津贴专家；科技部新一代人工智能战略咨询委员会委员；科技部863类人智能重点项目首席专家；语音及语言信息处理国家工程实验室执行主任；中科院人工智能产学研创新联盟应用规划组组长；中国科学技术大学兼职教授、博士生导师；中国人工智能学会副理事长，会士；中文信息学会的常务理事；湖畔大学二期学员。

（*本文为AI科技大本营整理文章，转载请联系 1092722531）

◆

活动推荐

◆

推荐阅读

专访ClickHouse创始人：数据库竞争依旧火热，技术整合势在必行商汤联手华科：提出文字检测模型GNNets，新颖模块可解决几何分布难题微信地位，牢不可破？为什么要学数据结构？| 原力计划支付宝也崩溃，中心化支付体系尚能饭否？Android 10 vs iOS 13，逐鹿手机操作系统之王！搞定面试算法系列 | 分治算法三步走公司倒闭，39 岁重新找工作，薪资不到 8000，太残酷！摩托罗拉的百年沉浮底层公链行业报告：国产公链未来应积极协助政企开发联盟链；跨链和分层等技术取得较大进展，链链互通将成为现实

你点的每个“在看”，我都认真当成了AI

讯飞轮值总裁胡郁：大数据是人工智能产业落地的必要保障| BDTC 2019

作者：雪_雪雪_球