夜雨听风投资 的讨论

发布于: 雪球回复:13喜欢:4
是不是算力不足的问题?

热门回复

2023-11-28 08:50

有可能是测试问题,比如阿里那次就是代码有问题没测出来,上线即挂。这次滴滴的原因还不清楚,但深夜挂掉,有可能是上新版本吧,互联网公司通常在业务量小的时候上新版本。当然也有可能是运维问题,比如突然硬件故障,而且还是那种单点故障,没法切的。

2023-11-28 09:19

理论上是如此,但是很多软件起步时都没预见到未来的规模会如此庞大,导致最初的设计不足,只能边跑边改,也许就遗留下一些单点问题了。阿里云全球的P0故障的单点问题是认证系统,2021年3月时微软云也发生了个几乎一模一样单点的认证故障(参见:网页链接 阿里云也没有从微软身上学到教训啊,果然是只能自己犯错才能学到教训)。有人概括说,“人类社会是个巨大的草台班子”,还是颇为形象的。

不存在所谓单点故障,系统设计就是避免单点,是跨区域垮机房,故障切换。是整个体系出问题,和机器没关系是人的问题,管理的问题

2023-11-28 12:55

即是开发问题,也是测试问题,更是管理问题。质量是全流程的事情。项目管理的时候,预计一周的工作安排三天写完代码,测试需要一个月的时候要求两天测完,测试仪器依赖不满足,采购流程一个月,整个项目周期才几天,bug没改分配到新项目了,都是各企业常有的事

我这里已经很多年没有停过电了,这种需要的冗余应该是很大的,背后有人付出了成本

首先是开发问题,其次才是测试问题,至于开发问题那就有得说了

不单纯所谓测试问题,是体系的建设管理有问题,正常流程这些问题是不可能搞到线上,那个程序员不写BUG

如果是测试问题,那说明问题更严重。说明技术上还处在钻木取火的原始阶段。

2023-11-28 09:31

哈哈哈哈,毕竟软件开发中有一条,早期避免过度设计,都不知道能不能活下来,当然是先把业务跑通上线了再说[大笑]

钱,钱,还是tmd的钱。15块钱的预算,只能吃一顿沙县,你要以满汉全席的要求来评测就很搞笑了。