实时音视频的技术难点

发布于: iPhone转发:67回复:81喜欢:88

$声网(API)$ IPO在即,可能有不少朋友感兴趣,我简单写一下,仓老师负责手机YY业务的时候和实时音视频搏斗了4年,还是有点心得体会的。

实时音视频的主要技术难点有五。

一、可用性。服务可用性能达到几个9,四个9就是99.99%可用。

二、延时。以视频会议为例,A地说话,到B地听到看到的时间就是延时。超过20毫秒的延时人耳就能感受到。

三、卡顿。卡顿就是网络上传输数据的时候丢了数据包,导致图像和声音或卡或顿。

四、终端适配。安卓、iOS、网页都要支持,配置好的手机要支持,配置低的手机也要支持(部分卡顿和延迟的原因来自手机配置低处理不过来),比如说非洲那些手机啊、印度那些手机啊,都要支持。

五、支持全球网络。北京老师讲课大凉山山区学生在线上课、中国和美国开视频会议、中国和非洲通视频电话,客户的需求,都得满足。

解决这些技术难点的时候优先处理音频数据,因为耳朵比眼睛灵敏,或者说眼睛比耳朵更会“脑补”。

比如左图,眼睛能脑补出来这是奥巴马,音频数据里要是有这么大比例的噪音数据在里面,耳朵就听不出来或者听着很难受。

主要的技术手段说穿了好像很简单,主要就是网络拓扑、last mile、数据路由、编解码,但却是一个艰难的长期的技术运营工作:1、持续监测;2、持续优化。

我前面说“搏斗”,真的是搏斗,这活太难了。

全部讨论

爱国米的小新2022-09-03 16:01

声网

爱国米的小新2022-06-29 10:24

声网

破壳人生2022-06-29 00:21

仓门弄网了,说实在的仓老师我也不确定这个技术优势会不会边际递减,看到声网在极力扩展应用边界。现在买入主要还是交易外部变化的估值修复和教育影响替代的业绩修复带来的双击

仓又加错-刘成岗2022-06-28 21:12

你的思考就很不错啊,不用我讲了。

破壳人生2022-06-28 18:00

技术优势是能构成护城河的(比如Nvidia),只不过我们日常接触到大部分是应用技术。一项技术是否构成竞争壁垒和优势与以下几个因素成正比:技术本身复杂度(音视频编码传输)、外部其他依赖干扰(网络环境、全球节点部署)、规模化。
同意楼下的一个观点,大厂的统治力更多其实体现在流量、资本等资源上,在这些需要长期投入的业务上定力、投入未必有声网这样的公司更好。
想当初用腾讯的直播服务,踩了不知道多少坑,还经常出问题

聪冲冲2021-02-06 14:29

大家不是很懂云相关技术?scale大小决定技术深浅,不是你们用下觉得不卡 音质好就是好。10万人同时在线和1000万人在线 拼的就是几个9的高可用和99p延迟了。简单说用的人越多,口碑都体现在获得最不稳定和延迟的那些人身上。

和你玩2021-02-03 10:24

20毫秒延时相当于两个人距离7米讲话,这要求太高了,不现实。

多看寡言2021-02-03 10:09

很多纯技术功能卓越的软件,只是昙花一现

sunnyamoy2021-02-03 07:36

1. 可用性体现厂商的综合能力,通常大厂占优。2. k歌超过10ms才听到自己的声音,会明显感觉到延迟。和别人通话可以超过100ms,“AirPods Pro 音频延迟低至 144ms”。3.卡顿和延迟,有丢包重传的因素,有链路延迟的因素,看腾讯对NBA直播提升的效果,网络协议,线路和基础设施的综合能力应该是很好的。云在游戏和音视频领域的地位,也是这个能力的证明。对于语音,终点编解码的影响占比不大,网络上的影响大的多,终端到基站(5G远好于4G),网络节点转发(自有IDC网络远好于公网),物理距离(北京上海多远,光速是多少)。

三冰2021-02-02 11:01

+1