聊聊视频会议的昨天、今天和明天

发布于: 雪球转发:12回复:8喜欢:37

分享人:rain 大湾汇价投俱乐部
整理 / 校对:佳茗 / 欧阳 大湾汇价投俱乐部
分享日期:2020年8月8日

未经分享人和大湾汇一致同意,严禁转载!部分配图来自网络,如有侵权,请联系删图。

各位朋友,大家晚上好。接下来我跟大家做一个视频会议简单的分享,我自己一直在做视频会议相关工作。今天跟大家分享一下视频会议的一些过去,包括当下的情况,未来的发展,希望跟大家有深度的交流。

我中文名叫赵加雨,英文名rain,我2003年加入了最早的视频会议公司WebEx,一直工作到2017年,待了差不多14年,前面几年是在国内,后面移民去了美国。我一直都是在WebEx做技术管理工作,2017年的时候从美国离职回国,当年4月份加入了网易,在网易云信做了两年时间CTO工作。

2019年6月份离职,创立了目前的公司,中文叫拍乐云,英文名叫Pano。Pano是全景的意思,中文的音译是叫拍乐,所以我们整个公司名和产品名都叫拍乐云。我在WebEx和网易云信都是做通讯视频会议相关工作,ZOOM的小伙伴也都是从WebEx出来的,作为一个WebEx老兵,我对ZOOM的一些成长经历和发展过程也非常了解。我在做拍乐云公司之前一直是在做技术相关工作,对于视频会议的产品技术都有在关注,今天就跟大家分享一下视频会议相关的产品和技术。

ZOOM是2019年4月份上市,我们知道今年疫情ZOOM股票走得非常好,上市之后前半年的走势也是其他美股上市的新股类似,前期会有一个小的涨幅,接下来在半年左右的解禁期之后,会有一个比较温和的下跌。但在今年开始春节之后,ZOOM股票又重新开始上涨,去年上市的时候差不多是100多亿美金,现在已经是700亿美金非常大市值公司了。疫情让视频会议变得非常重要,也促进ZOOM的用户量和股价都有一个非常大增长。

视频会议并不是一个很新的产品形态,我2003年加入WebEx做视频会议,WebEx公司是2000年就在纳斯达克上市的公司,WebEx跟Salesforce是两家最早上市的SAAS公司。2000年就已经有视频会议这样的产品形态,随着新的技术演进,视频会议本身又也在不断的演进和迭代,给用户带来一些新的惊喜。

今天跟大家来聊一聊视频会议的前世今生,我自己作为程序员,也把它称为1.0、2.0和3.0时代。先简单理解一下视频会议,它是一个音视频门类,其它的还有直播点播、音视频处理等等,相比直播点播,视频会议技术是门槛更高的产品形态。视频会议技术涵盖了非常多音视频技术分支,像音视频的编解码、网络传输、弱网对抗、音频3A(Acoustic Echo Cancelling、Automatic Gain Control、Active Noise Control)、服务端分发等等,所有这些处理都需要在很低的时延下面解决好。在实时通讯领域,时延超过400毫秒用户就会有感知,整个音视频通话的效果就会大打折扣。因此,实时这样的限定条件就极大的提升了视频会议的技术门槛,能够把视频会议产品做好的团队和公司其实非常少。

视频会议1.0时代毫无疑问是WebEx,公司2000年上市,2007年的时候被思科收购,当时的收购价是32亿美金。同时期的产品还有像Citrix的GoToMeeting,微软的Live Meeting,那个时候WebEx是绝对的领导者,2008、2009年之前它的市占率一般都在65%以上,市场占有率一直都是在2/3左右甚至更高,是绝对的领导者。ZOOM创立于2011年,在ZOOM成功之前,主要的视频会议玩家就是WebEx。

WebEx当时所处的年代还是一个PC互联网时代,2010年之前我们都理解为是PC互联网的时代,那个时候上网主要还是拨号上网,2000年左右带宽可能也就100多K,到2010年左右可能有几兆,整个上网方式还是以电脑、Web端、桌面软件为主。在当时的场景下,网络的带宽很受限,尤其是在WebEx刚刚创立的时候,WebEx把视频会议能够做到足够好,背后其实做了非常多黑科技来保障比较优秀的音视频体验。

WebEx做的最好的功能点是桌面共享、文档共享。除此之外,为了让产品整个应用性、功能都更好用,WebEx也有非常多的创新点,包括音视频、从browser里面启动 native client来提高产品的易用性,保障服务的高可用。

WebEx是最早定义视频会议这样的产品形态,在WebEx之前更多是电话会议,那个时候也没有文档共享,整个沟通的效率就会很差,要么就是直接出差。

WebEx产品里面很多功能都已经变成了语音视频会议产品形态的标配,像共享文档、云视频、聊天,都是视频会议产品标配了,2007年WebEx被思科收购之后,一直都没有太多的创新。ZOOM的CEO和创始人Eric,他之前是WebEx工程团队的负责人,后来Eric出来创立了ZOOM。

2011年ZOOM开始创立,2013年产品上线,后面产品越做越好,我自己认为视频会议的2.0时代代表公司就是ZOOM。ZOOM在创立和发展的年代跟WebEx有点不一样,ZOOM是创立于移动互联网年代,2011年到2013年整个移动互联网也在大发展,ZOOM在创业的过程当中,它就是完全适应移动互联网环境的产品,网速、上网的方式、上网的设备都有非常多的变化。

在这个大背景下面,ZOOM重新去实现了视频会议产品,功能点并没有太多的变化,但是在具体的技术细节、产品形态上面做了更多打磨和提升。在易用性、移动端、入会方式上面,ZOOM做了比较多创新,相比于WebEx被称为叫web conference,ZOOM被称为叫做video conference。从这两个产品的名字也可以看到ZOOM和WebEx的不一样,ZOOM作为视频会议2.0时代代表产品,在很多方面做得更好一些,目前在市场上的受认可度,在股价上面也都有对应的体现,目前ZOOM还是一个非常火的公司。

我们不妨来畅想一下未来,在未来5年10年视频会议产品形态还会怎么去发展?展望未来,视频会议在技术上,在大环境上的演进。5G会逐步的商用和更大规模应用,带来的是网速更快,接入网络的设备会有更多,可能会迎来真正的物联网时代。另外,接入网络的设备,device端可能也会有很多不一样的创新,像AR/VR这样的新设备。 

这样一个大背景下,我们来展望一下音视频产品还会有哪些变化和演进?我自己觉得可能会从两个维度创新,一个是RTC音视频本身,新的技术会再次推进音视频产品技术发展;第二个是音视频跟其他场景结合,可能也会带来更多的想象力。音视频本身也一直在不断的发展和迭代,我们至少可以看到这几个方向一定会有新变化和演进。

一个是编解码技术,主要是指视频编解码技术,前段时间视频的编解码H.266/VVC刚刚定稿。目前大家使用的主流技术还是H.264,这是在2003年定稿的视频编码标准。随着H.266的定稿、SD-WAN的应用,可能会再次推进视频编解码发展。

另外,随着更大的屏幕、更大的带宽,超高清视频可能会得到更广的应用。还有拥塞控制、网络分发,都可能会进一步推动音视频技术发展。还有边缘计算、SD-WAN、CND技术也在不断的迭代,WebRTC的发展使很多浏览器端接入音视频更容易,所有的这些变化都会推进音视频技术的演进和迭代。

第二个维度是音视频跟其他场景的结合,可能会带来更多的想象空间。音视频与AI,RTC (Real-Time Communication)跟AI之间的结合,AI在音视频领域已经被广泛应用。像语音识别、语音合成、图像识别、感知编码、超分、虚拟背景、降噪等等,AI技术本身也是最早在音视频领域得到应用。现在的四大AI独角兽,主要也都是在做计算机图像处理相关,随着AI技术的普及化,更多的数据沉淀,跟音视频会有更多领域产生结合。

我觉得在图像的编解码、回声消除、网络算法、拥塞控制,这些方面还会有更多的结合,这会进一步推动音视频技术的前进和演进。

另外,RTC加上万物互联里面物联网的Thing,随着更多的设备接入网络,这些网络可能有自己的数据采集,也可能会跟实时通信会有结合,不一定是视频会议这样的产品形态,可能是一个控制实时的交互。

第三点是RTC跟屏幕的结合。我们现在生活中智能的设备、智能穿戴设备、智能的大屏越来越多,甚至包括汽车上面的大屏,只要有屏幕的地方都可能会有音视频技术。我们完全可以在汽车的大屏上面去做音视频通话,也完全可以在的镜子或者手表上面做音视频通话,这些都是可行的。RTC一定会应用于更多的场景,疫情也已经在催生这样的变化。

我们现在用的比较多的还是视频会议,在线教育领域,RTC一定会与更多的场景做结合,包括云游戏的创新、云办公、云党建,跟健身、房产、医疗、金融,各种行业都可能会有一个融合。RTC可能会重新赋能现有的行业和场景,让很多事情都可以线上来做。最终可能是线上化和线下化的结合,但线上的场景会越来越多。我个人预判,视频通讯会变得跟支付、物流一样成为新基建,这次疫情强化了这个逻辑。音视频可能会变成很多行业的基础能力,重新改造我们生活当中的很多场景,RTC可能会无处不在。

中国的创新做的非常不错,我2017年回国以后,也是觉得中国的创新做的非常不错。中国在消费端非常拥抱创新,在生产端有非常多的创业公司在想尽很多方法来做创新。在国外一些网络云视频项目开源之前,真正能够做音视频应用的国内团队是没有的,能做音视频的应用的人基本上都是来自WebEx的小伙伴。随着网络上云视频会议系统的某些项目开源,国内也培养了更多的RTC人才。

RTC是技术门槛非常高的产品形态,随着像我们这样的团队人才的成长、技术能力的沉淀、拥抱创新的大环境,我们认为RTC跟各种场景各种应用融合的创新,未来非常有可能会出现在中国市场环境。这也是我去年出来创立拍乐云公司的原因。

我们觉得首先RTC会变成基础能力,它需要被高度可集成化,我们公司做的是一个音视频的PaaS,就是Platform as a Service,非常容易被集成到各种应用里面去。在中国这样大环境上面,可能会找到更多的应用场景,这也是我们创立公司逻辑。我们希望跟其他的创业公司一起推动RTC在中国市场的发展,迎来一个新的meeting3.0时代。我自己一直都是做产品技术相关,更多从产品技术的维度来跟大家做分享,看看大家有没有什么问题,我们可以来做一些交流。

 

讨论环节

Q:视频会议的技术壁垒主要是哪些?中国的团队在视频会议的底层技术上和国外的团队相比有没有差距?未来有没有可能超越甚至是引领技术潮流,特别是结合5G,中国的视频会议相关公司在资本市场的投资机会大不大?

A:视频会议的技术门槛还是比较高的,后面是WebEx的一群小伙伴出来创立了ZOOM,并没有其他的团队能够把视频会议产品形态做得非常好。这里面技术的门槛主是涉及到算法和工程的技术栈比较长,算法包括语音算法、视频算法,工程包括网络、编解码、QS、服务端的分发,这里面涉及到点很多。找到足够多的人才,能够把它系统化、工程化达到最好的效果,都要是在百毫秒级别把所有这些事情做好,这里面门槛就会比较高。最终体现在产品形态上面,要打磨到足够简单易用,整个前后过程各种门槛还是有的。

未来我还是比较看好中国,WebEx虽然它的主要工程在中国,但是核心技术在美国。去了美国之后,我才意识到有一些核心技术只有在美国团队才有,思科后来已经开放了很多技术。随着技术越来越开放,中国能够掌握相关技术的团队也很多,就像我们团队,我们也是在音视频领域沉淀非常深厚的团队。未来中国的团队一定可以在5G的场景下有更多的创新,甚至能够引领整个视频会议产品形态的创新。

 

Q:以前的H.323会议系统、基于MCU(Multi Control Unit)的会议系统与您分享的差别在哪?传统音视频厂场搞云视频难吗?

A:结合MCU方式的三代会议系统是比较传统的方式,华为、美国的思科也有这样的系统。这是在专网环境下面cost比较高的系统,对网络的要求,对资源的消耗都更高,它不是一个高性价比的方案。

随着internet的发展,网速变的很好,语音视频会议系统会降维能够适配到这些场景,ZOOM也有基于互联网的对应产品,它完全可以运用在会议室环境。从性价比,从技术的门槛,我觉得云视频会议可能会降维应用到更多H.323的会议场景。

 

Q:在家视频办公未来有没有可能结合VR,和科技电影一样,整体人体影像全部传输到办公室?

A:音视频结合VR/AR能够带来更多沉浸感的体验,做视频会议最重要的就是要给到大家易用性和沉浸感,包括沟通效率,AR/VR端结合,一定能够提升沉浸感和沟通的效率,我相信将来一定会带来更好的体验。

 

Q:音视频PAAS赛道容得下多家公司吗?中长期看竞争格局会是怎么样,强者恒强还是非常分散,海外这块的音视频PAAS格局咋样?

A:我认为音视频的PAAS一定可以容得下多家公司,很多To B的场景不像To C赢者通吃,To B市场还是容的下多家公司。音视频PAAS作为一个To B的业务,它需要有BD、有服务、有产品,对于不同的团队、不同的客户来说,它喜欢的服务、产品、BD的方式都不一样,这不是一个赢家通吃的市场。

我觉得未来可能会有3—5家头部的音视频PAAS厂商存在,在IAAS领域也是一样,现在阿里腾讯在做IAAS,UCloud、金山云也做得很好。PAAS可能会变得更加的通用,变成一个新基建,变成一个通用的能力。要想到走到这一步,也依赖于有多家顶级的PAAS厂商来提供能力,这样更多客户就不用自研,也不会考虑自研,会直接来采购。为什么IAAS相关公司这两年涨得很好,是因为大家的消费习惯反而被养成了。

阿里腾讯、金山、Ucloud、华为,提供了这么多IAAS选择,那就会导致绝大多数的公司都不再想去自研IAAS这一层。它直接采购就好了,有非常多样化的采购选择,这样反而可以把这个市场做得更大。

 

Q:思科、华为这种做传统视频会议的厂商做云视频有技术门槛吗?

A:因为思科收购了WebEx,思科掌握了语音视频会议核心技术,但主要问题是WebEx的核心团队现在都离开了。当然,它还是有不少团队和人才沉淀,思科拥有云视频会议技术的核心能力。

而华为稍微有点不一样,华为还没有语音视频会议产品的技术能力,它也在积累,也在沉淀,但是需要花多少时间才能够具备这样的能力,这还是一个问号。

 

Q:再请教下赵总,像这种独立的第三方云视频产商,主要的盈利模式是怎么样的?未来会有更多的消费场景吗?

A:音视频PAAS的厂商有点像传统的运营商,基于PSTN( Public Switched Telephone Network )的网络来提供通话服务,而音视频的PAAS是基于互联网提供通话服务。互联网的基础设施建设好以后,可以提供更多的承载更多的临时性的通话,这里面一定有非常多的市场空间和盈利。


 @今日话题  

 #视频会议#   #ZOOM#  #WebEx# #音视频# #SaaS#

喜欢本篇内容请点赞 + 关注哦。您的鼓励是我们做优质原创内容的动力,谢谢!

全部讨论

2020-10-10 00:07

变得更加的通用,变成一个新基建,变成一个通用的能力。要想到走到这一步,也依赖于有多家顶级的PAAS厂商来提供能力,这样更多客户就不用自研,也不会考虑自研,会直接来采购。 学习逻辑

2020-10-15 09:26

很好的分享,谢谢

2020-10-10 00:04

结合MCU方式的三代会议系统是比较传统的方式,华为、美国的思科也有这样的系统。 宝利通应该榜上留名

2020-10-10 00:00

工程包括网络、编解码、QS、服务端的分发 猜是QoS

2020-10-09 23:56

小笔误,还有边缘计算、SD-WAN、CND技术也在不断的迭代 此处应该是CDN~

2020-10-09 17:27

实时视频通话和会议的限定条件极大的提升了视频会议的技术门槛,能够把视频会议产品做好的团队和公司非常少。

2020-10-09 16:46

国内的音视频PAAS厂商声网科技已经在纳斯达克上市,腾讯也提供音视频PAAS服务,拍乐云面对这些竞争对手的策略是什么?

2020-10-09 16:29

视频会议 公司 科普 Mark