回顾 CrowdStrike 灾难：这真的是 IT 历史上最严重的中断吗？

网络安全巨头 CrowdStrike 是全球 Windows 宕机事件的幕后黑手。该事件被广泛描述为计算历史上最大规模的中断。但是，事实真的是这样吗？我们盘点一下。

2024 年 7 月 19 日星期五，全球 IT 行业陷入困境。上午的时候，数百万台 Windows 计算机开始显示著名的蓝屏死机。据微软称，超过 800 万台机器无法访问，导致世界各地的运营商、电视频道、航空公司和医院陷入瘫痪。

很快就清楚了由 CrowdStrike 部署的更新与微软合作的网络安全巨头是这场混乱的幕后黑手。显然，该公司在没有进行任何测试的情况下就推出了 Falcon 的更新，该公司的防病毒软件已集成到 Windows 中。 CrowdStrike 声称其基于云的测试系统遇到了错误。这导致了部署“更新有问题”。尽管 CrowdStrike 在漏洞发生后不到两小时内就回滚了补丁的发布，但数百万台计算机已经下载并安装了该更新。

另请阅读：为了弥补巨大的中断，CrowdStrike 发送了 10 美元的礼品卡（无效）

史上最严重的崩溃？

在部署当天，错误的 CrowdStrike 更新导致真正的地震在某些活动部门。周末航空公司被迫取消数千个航班。在美国，有3000多架飞机无法起飞。这次中断造成的巨大影响部分是由于Windows在计算机上无处不在，尤其是在专业领域的机器上。事实上，全球有不到 70% 的计算机安装了微软的操作系统，据透露政治家。

Semperis 首席技术专家 Guido Grillenmeier 在对 01Net 的回应中强调，停电的影响类似于“精心策划的供应链攻击”。专家将 CrowdStrike 灾难的后果与 SolarWinds、Kaseya 和 NotPetya 等著名攻击的后果进行了比较。据他介绍，“对受害者的影响是相同的”。

ESET France 公共事务总监 Benoit Grunemwald 在接受 01Net 采访时并未认同这一观点。对于网络安全专家来说，中断的后果并不严重不常见的措施与网络攻击有关。

“表面上看是类似的，但是修复还是很快的。例如，如果您的勒索软件导致 10,000 台或 100,000 台机器损失惨重，那么您不会因为回到过去而在两天内离开。”，我们的对话者说道。

一场金融灾难

不出所料，该事件引发了失去一笔财富受影响的企业。据大型保险公司 Parametric 估计，Windows 故障导致财富 500 强企业损失高达 54 亿美元的收入和毛利润，专门从事网络安全的保险仅覆盖此类故障造成的损失的 10% 至 20%。

医疗保健公司、银行和航空公司因 CrowdStrike 中断而遭受的损失最为严重。据 Parametric 估计，由于防病毒更新错误，医疗保健巨头损失了近 20 亿美元。与此同时，银行业损失超过 10 亿美元，而六家财富 500 强航空公司的损失为 8.6 亿美元。

距离完全康复还有几周？

此外，CrowdStrike 中断的特点首先在于解决时间特别长。仅仅部署 Falcon 防病毒补丁来让一切恢复正常是不够的。要解决中断问题，IT 管理员必须手动通过在每台受影响的机器上。正如 Forrester 副总裁兼首席分析师 Andras Cser 所解释的那样：“解决这个问题需要付出相当大的努力”。即使使用微软提供的恢复工具，这项任务也非常繁琐。

“由于更新的部署方式，受影响机器的恢复选项是手动的，因此受到限制：管理员必须将物理键盘连接到每个受影响的系统，启动到安全模式，删除受感染的 CrowdStrike 更新，然后重新启动””，Andras Cser 解释道。

该事件迫使受影响的公司分配大量人力资源。在这样的背景下，这个问题就更加成问题了缺乏合格的劳动力在 IT 和网络安全领域。这是美国众议院在致 Crowdstrike 首席执行官 George Kurtz 的传票信。在我们的采访中，Benoît Grunemwald 还指出了影响整个 IT 行业的劳动力短缺问题：

“我认为，无论如何，在网络世界中，我们已经看到劳动力短缺有一段时间了，因此，在我看来，这种劳动力短缺尤其在这个假期期间感受到的说法似乎并没有误导。

Le 计时你的bug灾难的规模也起到了一定的作用。事情发生在暑假中期，周末之前。正如 Forrester 首席分析师 Allie Mellen 指出的那样，“周五晚上，当人们回家过周末时，一些地区发生了干扰。”事实上，不一定有工作人员可以做出有效反应。

之前影响 IT 的中断

为了更好地了解 CrowdStrike 故障对全球造成的影响，我们回顾了 IT 历史上曾经发生过的故障。近年来，许多数字巨头发现自己陷入了与微软和CrowdStrike相同的境地。

Facebook、Instagram 和 WhatsApp 无法访问

我们先提一下2021年底发生的Meta宕机事件。在几个小时内，Facebook、WhatsApp、Instagram以及该集团的所有服务完全无法访问。我不得不等待超过六个小时所以 Meta 工程师可以解决这个问题。门洛帕克公司指出“错误的配置更改”其计算机服务器。事实上，一名技术人员在进行日常维护时发出了一条命令，阻止所有互联网用户访问 Meta 的数据中心。

亚马逊网络服务中断

同年，亚马逊遭遇严重失败。领先的云主机之一亚马逊网络服务（AWS）遭遇故障。近十个小时的时间里，许多网站变得无响应。 Disney+、Netflix、Tinder 或 Coinbase 等网站无法访问。亚马逊服务也是如此。根据记录，AWS 拥有超过 30% 的云托管市场份额政治家。这就是大部分网络无法访问的原因。

与OVH的比较

作为我们采访的一部分，Benoit Grunemwald 相反将 CrowdStrike 灾难与OVH 遭遇故障法国托管提供商，2021 年。斯特拉斯堡的一个数据中心发生火灾后，大量网站发现无法访问。对于 ESET France 专家来说，OVH 中断的影响比 CrowdStrike 的影响大得多。事实上，袭击 OVH 的火灾伴随着大量数据丢失。事件期间许多地点被清除。