风险与胜率 的讨论

发布于: 雪球回复:15喜欢:3
比如一个直播间,突然观看人数猛彪,这种高并发实时音视频处理也麻烦吧?

热门回复

不会吧,一台服务器挂了,不会引发雪崩,服务器每时每刻的峰值都不一样,一般都提供50%-100%的冗余,挂了一台,系统自动摘掉,恢复了自动加入,同时系统也有剩余资源池,自动扩缩容。真到系统没资源提供了,不行了,超载的时候,也会系统自动限流降级,这种稳定性比简单强多了,用户体验也好多了。要做到稳定性99.95%~99.99%可没有那么容易,微博稳定性我估计最多到99.5%.

没那么简单,信令拥堵、last mile带宽上限、单机带宽上限、新区域路由(比如本来预计北京观众参加的直播涌进来大量重庆观众)等等,最可怕的是造成雪崩效应,一台服务器挂了,流量都涌到下一台服务器,瞬间挤爆,然后继续涌到剩余的服务器上,知道挤爆所有的服务器。

2020-06-27 15:52

10多年前,阿里的负载均衡设备还是我主要参与选型的,今天被说成外行了[哭泣][哭泣][哭泣]

你说得对,我们是外行,但是如果真如这个球友所说,为什么会出现你之前所说的雪崩效应呢?理论上这个冗余不是已经考虑到了吗……

等修好了再提供服务

几千万同时在线的直播,就更复杂了。

2020-06-27 15:40

说雪崩效应难处理的不是我, 现在技术好点的公司服务降级都演练很成熟了。 我说修好了再上线,只是和雪崩效应相比更简单粗暴。


早期阿里技术还没引入服务自动降级的时候,发生雪崩效应就是拒绝一部分客户IP来实现手动服务降级。

别跟外行争论。。。

2020-06-27 01:10

高手,最喜欢这种简单粗暴的设计。 有一些设计者就是想得太多了,追求理论完美,引入太多的容错环节反而整个系统更不稳定了。

这台服务器上的上万用户就再也不提供服务了?