Face++:估值超过20亿美元,“最聪明公司”是如何长大的?

发布于: 雪球转发:2回复:2喜欢:2

联想控股官方微信:联想控股微空间

6月27日,《麻省理工科技评论》发布了“2017年度全球50大最聪明公司”榜单,联想控股旗下联想之星的被投企业——旷视(Face++)凭借核心的刷脸技术以及开拓全新的使用场景成为9家中国上榜企业之一,并高居第11名。不久前,Interbrand发布了“2017全球最具突破性品牌(Break Through Brands of 2017)”榜单,旷视成为唯一入选的中国人工智能公司。

作为国内计算机视觉的领先者之一,旷视(Face++)的市场估值已突破20亿美元。人工智能是否真的迎来了商业化的春天,在金融、安防、医疗等垂直领域究竟有着怎样的前景?今天,我们为大家带来旷视市场副总裁谢忆楠的分享。

首取金融业

2011-2012年刚成立的时候,团队并没有想好特定的方向,首先要做出一个很通用化的平台出来。我们认为,人脸识别的技术如何落地,最终要结合行业应用来看,让行业去判断。我们做了很多基于人脸识别的底层方案,成为中国第一个面向开发者提供人脸开放平台的公司。

4年左右的时间,旷视已经成为世界上最大的人脸识别调用公司之一,目前Face++人脸云平台每天的调用量超过2000万次。在开发者圈里,大家都用Face++作为公司代号,成早期最有影响力的一个形象符号。我们在品牌打造上基本把两种叫法连起来了,变成现在的旷视(Face++)。

公司要扩大,技术要落地,都必须先走通“技术-产品-数据”这样一个商业闭环。从软件变成产品,从产品变成数据,技术一定是要深入到行业变成“AI+行业”才会发挥作用。2013-2014年,我们开始为产品在相关行业的商业化落地做准备,研究技术能为哪些行业提供具体的服务,并且让技术有普适性。

很快,国家实名制工作相继在网络、电信和金融领域全面铺开,同时引发了一个讨论:作为技术手段的人脸识别,可否帮助银行完成远程开户,实现所谓的“柜台远程化”?

这成了一个好时机,基于行业特性,我们做了很多技术研究,最终在泛金融领域中,提供三种技术支持:人脸检测、关键点标注和人脸识别,当时这三项技术,先后获得3个国际计算机视觉竞赛的冠军,包括由美国电气和电子工程师学会(IEEE)主办的国际计算机视觉大会(ICCV 2013)。

旷视进入的第一个行业就是金融。行业和行业之间对技术的要求很不一样。比如,银行采用人脸识别技术的时候,对比的是身份证的照片和客户在柜台前拍摄的照片,貌似很容易,但实际情况中会有很多因素干扰它。

第一,线下场景的光线不可控,很多柜台的环境是半开放式的,客户坐的位置是强背光,抓拍人脸时,脸会很暗;第二,每个柜台都有一个玻璃隔断,且有些玻璃会贴膜,当膜产生反光时,机器会看到“反光影像+真实人脸”两张脸,因此在训练机器的时候,要让它知道,哪一张脸是需要识别的。

现在,大家都熟知活体检测技术,当年,为提升它的抗攻击性,我们花了很多精力。今年央视的315晚会上,公布了攻击活体验证的方法,当天市面上很多跟人脸识别相关的业务都下线了,因为这些厂商没有太多的技术积累。合作方蚂蚁金服知道我们技术抗攻击能力,所以不怕所谓的攻击。

技术落地的过程中,有很多实际应用问题会反向指导技术,我们在那两年里集中攻克,变成泛金融领域中提供智能金融企业解决方案的服务商,我们称之为“互联网身份验证服务”,包括直播、出行、共享经济等行业都和我们有合作,我们也是第一个进入到客户验证身份领域中的企业。

传统银行是一个大系统,如若业务全国铺开,是总行的概念。你要有极大的魄力去推进技术架构的发展,所以银行比较谨慎,需要慢慢尝试,可能有几个业务点位先尝试,比如辅助验证,ATM机具。

                        

突破口在于新业务的使用,目前技术的准确度已经达到行业需求。银行系统本身过于庞大、复杂,如若想要使用人脸识别技术,要把技术在每一个业务流程上都想得非常清楚,需要总行技术部、技术集成商和平台服务商三方一起推动。

互联网金融与传统金融核心的区别就是,前者是偏轻的线上云服务,后者是偏线下运维模式。传统银行的业务定制化更多,需要有很强的现场实施能力,需要有项目团队,及较强的技术支撑。比如,每家对于人脸的在每一个流程当中出现的节点不一样,预值需要调整的程度不一样,视频流的规格也不一样,很难标准化,这是大银行不好做的另外一个原因。

目前,旷视(Face++)的智能金融企业解决方案已应用在中信银行、招商银行、北京银行等多家传统金融机构的多个业务场景中。大概2017年底前后,有些银行会将人脸识别技术作为APP远程身份验证的一种工具。

算法服务产品

如果说,银行是从上向下的过程,那么公安则是一个从下向上的过程。每个区和每个区做的东西都不一样,旷视安防业务线工作人员也相对很多。需求非常多样化,比如有抓逃需求,也有酒店实名需求,各地预算和规划都不同。我们制定出一个比较好的产品矩阵,把不同的产品和场景对应起来。

2016年的行业数据显示,全国各地安装的摄像机数量已经有2500万台左右,已初步构建起覆盖公共区域要害部位的视频“天网”。摄像机数量很庞大,提供的有效数据却很有限。抓捕罪犯的时候,摄像头不能告诉我们嫌疑犯在哪里,只能是执法人员在某个范围内,把所有视频调出来,再安排大量的人力去查看。对公安来讲,这样的数据服务叫“事后警务”。

                                        

今年“十三五”提出了一个概念,叫智能公安,或者说社会综治体系。它对视频“天网”提出了一个新要求,事后警务要变成事中警务,甚至是事前警务,一旦摄像头网络里出现了目标对象,应该让机器告诉我们——“坏人来了”。

第二件事,要把视频网络里面的数据变成可搜索的特征,比如年龄区间、身高多少、是否戴眼镜、穿什么样的衣服、骑车还是开车,这些组成在一起是可以被搜索的,叫“视频结构化”。公安把这些信息组合起来,可以在短时间内对大量视频进行搜索,极大程度缩小目标范围,快速锁定符合要求的视频。

现在市面上很多的安防公司都在做这件事情,但是关系到位了,产品没有到位,也不会上线的。在这个行业中一定是技术强,关系也要强。

旷视成立了专门团队去了解刑侦到底需要什么,并将调研的结果拿到产品和技术上去实现。比如,针对人像卡口项目第一个落地的城市无锡,我们组建全国“三逃”人员、江苏省缉控人员、无锡本地扒窃等人像库,依托市局人像数据支撑,向各部门提供人像比对服务。

譬如无锡市旧城区的智能化布控改造,有三四家竞争,最终我们拿到了项目。当时无锡项目是25人的团队,在当地工作2个月左右的时间,对四个区域内的2000多个摄像头进行了整体察看,一期便改造了100多个。

截至2016年底,我们具备视频结构化技术的智能视频侦查系统已经协助25个省市的警方,抓获了在逃人员和犯罪嫌疑人500多名。

未来,人与机器之间会是一个交互协作的关系。比如旷视的门禁系统,就是机器与我们人类产生的一个交互,相当于一个“小前台”的概念,员工来了之后,门自动就开了。现在只是一个个局部的小点,未来会越来越多,最终人和机器交互起来的时候,就会形成真正的大物联网的概念。

目前国内人工智能市场仍处在存量消化阶段,像金融、地铁、火车站都开始用人脸识别技术,有点像支付宝刚开始做移动支付一样;在教育、公共交通、社保、零售等领域还没拓展开,有七成左右的市场空间有待开发。

旷视做产品有一个标准,就是这个东西一定是相对可复制的,比如可能是一个刑侦的模块,下次可以复制到很多地方。新领域的潜力很大,但是不能乱做。比如我们甚至接到需求说,养鸡场希望识别出哪些是公鸡,哪些是母鸡,真的做出来了可能只有养鸡场会用,其他地方不会用。

可以这么讲,旷视的产品面向行业需求,我们的算法是服务于产品,不是说做了一个算法,然后有个产品。我们是反推算法,行业需要什么样的算法,再根据它构建一个更大的轮廓,在外围不断地填充我们的边界。

                                                           

旷视有包括人脸、行人、文字再到车辆的“4+X”技术路径,但我们首先做好顶层设计,剩下的X由行业驱动。

作者:沈玉姗

来源:二十一世纪商业评论

全部讨论

2017-07-20 22:43

行业前景广阔

2017-07-05 12:04

一边玩去,你跑错地了。