微软流年不利?数据中心故障,全球Windows蓝屏

发布于: 雪球转发:0回复:1喜欢:0

当地时间7月18日晚,微软发布消息称,美国中部多个地区Azure 区域数据中心出现故障,影响了Microsoft 365应用、Xbox、OneDrive等服务。

微软建议用户等待半小时至一小时后再次访问服务。但在几个小时后的7月19日凌晨1点左右,一场更加巨大的Windows蓝屏风暴席卷了全球。

美国、新西兰、澳大利亚、日本和印度等国家纷纷开始报告大面出现Windows电脑蓝屏死机问题。故障覆盖了企业和个人用户,严重影响了业务和日常使用。特别是航空、金融、酒店等领域受到影响后,业务被迫中断。

美国联邦航空管理局发出警报,由于本次故障,美国航空、美国联合航空和达美航空已请求美国联邦航空管理局对三家航司所有航班实施全球停飞

其他被故障影响包括某些 Microsoft 服务受到严重干扰,美国多个州的 911 服务中断,伦敦证券交易所的服务中断,天空新闻停播等

故障也影响了部分中国用户,有上海地区酒店发布公告称,微软数据中心的相关故障,导致目前上海区域的大部分酒店相关操作系统无法正常使用

虽然微软Azure 区域数据中心故障与全球蓝屏故障相继发生,但无法确认两者之间是否有关联。

根据目前信息,微软表示Azure 区域数据中心故障是因为后端群集管理工作流部署了配置更改,导致Azure存储群集的一个子集与美国中部区域的计算资源之间的后端访问被阻止。这会导致在与虚拟磁盘失去连接时自动重新启动。

至于全球范围的大面积蓝屏事件,则已经确认为第三方安全软件CrowdStrike更新导致的系统崩溃。具体故障是CrowdStrike的Falcon Sensor代理(csagent.sys)在更新后引发了“WIN32K_POWER_WATCHDOG_TIMEOUT”错误,导致系统无法正常启动并出现蓝屏。

CrowdStrike已经承认了这一问题,并正在积极调查和解决中。CrowdStrike的一位代表在公司论坛上发布了一条置顶消息,表示“我们意识到一个广泛的问题,导致Windows机器在运行各种传感器版本时出现BSOD错误。我们正在积极调查原因,并将尽快提供解决方案。”

CrowdStrike 官方也提供了临时解决方案:

如果您的系统出现蓝屏,请尝试以下方式修复:

1、通过恢复模式启动,或者多次异常重启进入安全模式;

2、重命名以下文件为其他文件名:

C:\Windows\System32\drivers\CrowdStrike\csagent.sys

或者直接重命名以下文件夹

C:\Windows\System32\Drivers\Crowdstrike

官方说明链接(注意需要CS用户登录之后才能访问): 网页链接

| 文章来源:中国IDC

• END

精品再读

分析2024年1-6月223个新智算项目,发现了5个信号|算力产业核心内刊

算力中心建设月报(2024年6月)IDC圈一周最Hot

产业调研

《2023-2024年中国IDC行业发展研究报告》

东数西算各地进度如何?

上海如何推动智能算力集群建设?

全部讨论

07-19 19:12

全球压力测试