华为首次投资国内AI公司,“多模态深度语义理解技术”成竞逐焦点?

发布于: 雪球转发:1回复:0喜欢:1

近日,在投资了山东天岳和杰华特之后,华为旗下的哈勃科技投资有限公司有了新的投资动向——以数千万元注资国内人工智能第一梯队企业深思考。这是一向神秘低调的华为首次出手投资国内的AI公司。

据被投企业官网介绍,成立于2015年的深思考人工智能,是一家专注于类脑人工智能与深度学科技的AI公司。

该公司最突出的技术是“多模态深度语义理解引擎(iDeepwise.ai)与人机交互技术”,该引擎技术可同时理解文本、视觉图像等多模态非结构化数据背后的深度语义,其中以“长文本的机器阅读理解技术、自由跨域的多轮人机对话技术、对多种模态信息的语义理解技术”三大技术,抢占了市场的先发优势。

多模态语义理解技术,向来被誉为“人工智能皇冠上的明珠“。也许正是因为深思考拥有着这一核心技术,才让华为向其抛出了橄榄枝。那么我们不妨来探讨一下:该技术究竟有何亮点,甚至能让巨头趋之若鹜?

下一个人工智能的爆发点?

目前来看,AI技术的发展会经历“感知、识别、理解、决策”这四个阶段。其中感知和识别在业内已经发展不错,但理解却一直进展缓慢,如骨鲠在喉。

据业内专家介绍到,“多模态深度语义理解技术”的出现,让AI的发展产生了质的飞跃。它可以帮助人工智能实现从“看清听清”到“看懂听懂”的过程,让AI更深入地去理解真实世界。

如果做个比喻的话,多模态语义理解技术就相当于人的大脑,它可以接收来自不同感官的信息,并做出最恰当的理解和认知,最后再通过最终端进行反馈,完成从感知到理解的人机交互——这让机器变得更加智能。

据了解,基于多模态深度语义理解技术,深思考在去年8月推出深思考大脑(iDeepWise.ai 4.0),帮助机器理解文本、视觉图像背后的真正语义。

凭借此项技术,深思考获得在中文语义理解与人机交互领域高水平的SMP2018-ECDT赛事中获得冠军,蝉联2017、2018两届冠军,实力不容小觑。就是今年 8 月结束的" 2019 机器阅读理解竞赛"中,在两项核心技术指标中,深思考均位列第一,从全球 2000 多支队伍中脱颖而出,摘得桂冠。

截止目前,深思考拥有百余项知识产权,其中内核级创新发明专利32项,国际国内奖项19项等。多项殊荣,奠定了深思考为国内“多模态深度语义理解”先驱地位。

当然,对于一项AI技术而言,判断其是否真正成熟,光看实验室数据和奖项是远远不够的,而是在于:这项技术是否能够真正落地?

据悉,深思考目前基于AI多模态深度语义理解技术与人机对话产品,已经在智慧医疗健康、智能汽车、手机智能移动终端、智能家居等应用场景实现落地。

在医疗行业,病理诊断和筛查是医学诊断的“金标准”,是医生对病人进行正确治疗的基石,也是防治癌症的重中之重。AI赋能医疗,则让病理细胞诊断和筛查技术开始走到了前沿,让人们看到了新希望。

在以往,医生要在不到一寸的载玻片上筛查上万个大量细胞,找到病变细胞后再根据细胞形态、组合进行诊断,可谓大海捞针,且精确度难以确定。基于这样的痛点,深思考基于多模态深度语义理解与人机对话引擎(iDeepWise.ai),提供了对于病理细胞的视觉语义理解产品ideepwise.AICIAS与人机对话式的健康咨询AI Saas服务。

以宫颈癌的筛查为例,人工智能辅助阅片系统(ideepwise.AI CIAS)可以帮助医生对宫颈细胞进行筛查与诊断,提高宫颈癌筛查时效和精密度。

据悉,这套系统可以快速进行AI宫颈癌筛查,能够在60秒内分类7万个细胞。这相当于把“针”送到了医生面前,极大地降低病理医师工作量及工作强度,提高病理筛查效率和诊断准确性。

而在智能手机终端场景下,深思考基于多模态深度语义理解与人机对话引擎(iDeepWise.ai),提供出行、健康咨询、智慧办公、休闲娱乐等场景的智能人机对话交互iDeepWise.ai.mobile 的AI Saas 服务,该引擎可以为2亿智能终端用户提供一站式AI智能出行生活服务,包括通过人机对话自动完成机票火车票预订、酒店预订等服务。

反观华为,作为通讯产业的巨头,最近在人工智能各个应用场景的布局也是动作频频。

华为于今年5月成立智能汽车解决方案事业部,定位为智能汽车领域的端到端业务的责任主体,提供智能汽车ICT部件和解决方案。

在此之前,华为也建立起了智慧医疗平台:华为“全联接医疗”,通过大数据、云计算技术的深度融合打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,构建智慧化医疗服务体系。

而在刚刚举办的2019华为全联接大会上,华为还正式发布了企业服务发展战略2.0,并宣布未来五年,将投资超过10亿美元,打造智慧服务,开创未来智能服务的新格局。

——实际上,已经不只华为这一家巨头在构建人工智能生态了,BAT都在积极布局。也许,现在真正到了“多模态语义理解”大展拳脚的时刻。

AIot时代下的“炼金术”

对于巨头公司,尤其是ICT领域的巨头公司而言,其拥有的海量数据,就是储量丰富的金矿,但如果无法挖掘和发挥数据的价值,数据的存在便变毫无意义。他们拥有用户、产品和场景,却缺少人工智能这样的“炼金术”,来帮助炼金,从而最终在同类型公司之中胜出。

智能家居场景为例,智能音响、智能电视、智能冰箱、智能空调等产品,最终需要被语音理解所赋能,提升理解能力,真正做到人工智能。

结合多模态语义理解技术,这些智能家居和智能硬件,不再是简单的人类语音命令执行者,而是变成了隐形人工智能管家的触点,他们会更了解人类的需求和习惯,并提供更加个性化和人性化的服务。

以智能车联网为例,5G和人工智能的发展,让自动驾驶和车联网都被给予厚望。

传统智能车载系统,通常通过驾驶室的智能语音交互屏幕实现人机互动,而在智能车联网场景下,汽车跟道路基础设施之间、汽车跟汽车之间、汽车跟互联网之间都能够做信息的连接和交互。车辆本身也通过视觉对车外的环境做感知与理解,再加上温度传感器、语音信息输入传感器等。

对于用户而言,语言是最有效的交互方式,但对于车辆而言,要接受和理解的语言,并且在极短时间内做出反应,是有巨大的挑战。而除了语言的模态外,智能车联网还有手势的模态和图像的模态等信息。

数字化场景下,深思考提供的技术能为对上述多模态信息进行综合理解,为人车交互提供智能大脑,同时,还可以在座舱环境下,实现人、车和家庭的连接。加上RPA自动软件机器人,不光可以实现人车对话,车辆还可以自动帮助驾驶员完成任务,比如预定会议室、与其他智能设备的联动、执行等。

“更重要的是解决及提升物联网和AIoT设备多模态语义理解的能力。”杨志明博士在此前的采访中曾提到。

未来的场景之中,更多的情况是,终端设备首先具备各项传感器,能够多维度的收集信息和数据,同时端侧AI芯片的植入,又能让这类设备具有如图像识别、语音识别、语义理解等人工智能能力,而云端则是更强大的算力和服务支持。

一方面,如果所有终端的处理,都由云完成,性能和响应可能会成为瓶颈,另一方面终端设备必须具备AI理解的能力,才能让机器更好的理解人类意图。下一个时代必定是AIot的时代,也是人工智能多模态语义理解的时代。

MORE | 更多精彩文章

● 互联网公司还要亏多久?

● 杨国福不是张亮的舅舅,小米logo背后竟有这层意思,那些你不知道的商业冷知识…(2) | 不图不快

● 这个“忽悠”马云10亿的男人,还了阿里巴巴5000亿

凉凉的NBA在中国捞了多少钱?| 不图不快

● 2.8元懒人支架月销量25万;“起死回生”方便面一年卖出400亿份...懒人经济消费崛起 | 邦TOP

你这么好看,还不点“在看”