网络安全巨头 CrowdStrike 是全球 Windows 宕机事件的幕后黑手。该事件被广泛描述为计算历史上最大规模的中断。但是,事实真的是这样吗?我们盘点一下。
2024 年 7 月 19 日星期五,全球 IT 行业陷入困境。上午的时候,数百万台 Windows 计算机开始显示著名的蓝屏死机。据微软称,超过 800 万台机器无法访问,导致世界各地的运营商、电视频道、航空公司和医院陷入瘫痪。
很快就清楚了由 CrowdStrike 部署的更新与微软合作的网络安全巨头是这场混乱的幕后黑手。显然,该公司在没有进行任何测试的情况下就推出了 Falcon 的更新,该公司的防病毒软件已集成到 Windows 中。 CrowdStrike 声称其基于云的测试系统遇到了错误。这导致了部署“更新有问题”。尽管 CrowdStrike 在漏洞发生后不到两小时内就回滚了补丁的发布,但数百万台计算机已经下载并安装了该更新。
史上最严重的崩溃?
在部署当天,错误的 CrowdStrike 更新导致真正的地震在某些活动部门。周末航空公司被迫取消数千个航班。在美国,有3000多架飞机无法起飞。这次中断造成的巨大影响部分是由于Windows在计算机上无处不在,尤其是在专业领域的机器上。事实上,全球有不到 70% 的计算机安装了微软的操作系统,据透露政治家。
Semperis 首席技术专家 Guido Grillenmeier 在对 01Net 的回应中强调,停电的影响类似于“精心策划的供应链攻击”。专家将 CrowdStrike 灾难的后果与 SolarWinds、Kaseya 和 NotPetya 等著名攻击的后果进行了比较。据他介绍,“对受害者的影响是相同的”。
ESET France 公共事务总监 Benoit Grunemwald 在接受 01Net 采访时并未认同这一观点。对于网络安全专家来说,中断的后果并不严重不常见的措施与网络攻击有关。
“表面上看是类似的,但是修复还是很快的。例如,如果您的勒索软件导致 10,000 台或 100,000 台机器损失惨重,那么您不会因为回到过去而在两天内离开。”,我们的对话者说道。
一场金融灾难
不出所料,该事件引发了失去一笔财富受影响的企业。据大型保险公司 Parametric 估计,Windows 故障导致财富 500 强企业损失高达 54 亿美元的收入和毛利润,专门从事网络安全的保险仅覆盖此类故障造成的损失的 10% 至 20%。
医疗保健公司、银行和航空公司因 CrowdStrike 中断而遭受的损失最为严重。据 Parametric 估计,由于防病毒更新错误,医疗保健巨头损失了近 20 亿美元。与此同时,银行业损失超过 10 亿美元,而六家财富 500 强航空公司的损失为 8.6 亿美元。
距离完全康复还有几周?
此外,CrowdStrike 中断的特点首先在于解决时间特别长。仅仅部署 Falcon 防病毒补丁来让一切恢复正常是不够的。要解决中断问题,IT 管理员必须手动通过在每台受影响的机器上。正如 Forrester 副总裁兼首席分析师 Andras Cser 所解释的那样:“解决这个问题需要付出相当大的努力”。即使使用微软提供的恢复工具,这项任务也非常繁琐。
“由于更新的部署方式,受影响机器的恢复选项是手动的,因此受到限制:管理员必须将物理键盘连接到每个受影响的系统,启动到安全模式,删除受感染的 CrowdStrike 更新,然后重新启动””,Andras Cser 解释道。
该事件迫使受影响的公司分配大量人力资源。在这样的背景下,这个问题就更加成问题了缺乏合格的劳动力在 IT 和网络安全领域。这是美国众议院在致 Crowdstrike 首席执行官 George Kurtz 的传票信。在我们的采访中,Benoît Grunemwald 还指出了影响整个 IT 行业的劳动力短缺问题:
“我认为,无论如何,在网络世界中,我们已经看到劳动力短缺有一段时间了,因此,在我看来,这种劳动力短缺尤其在这个假期期间感受到的说法似乎并没有误导。
Le 计时你的bug灾难的规模也起到了一定的作用。事情发生在暑假中期,周末之前。正如 Forrester 首席分析师 Allie Mellen 指出的那样,“周五晚上,当人们回家过周末时,一些地区发生了干扰。”事实上,不一定有工作人员可以做出有效反应。
之前影响 IT 的中断
为了更好地了解 CrowdStrike 故障对全球造成的影响,我们回顾了 IT 历史上曾经发生过的故障。近年来,许多数字巨头发现自己陷入了与微软和CrowdStrike相同的境地。
Facebook、Instagram 和 WhatsApp 无法访问
我们先提一下2021年底发生的Meta宕机事件。在几个小时内,Facebook、WhatsApp、Instagram以及该集团的所有服务完全无法访问。我不得不等待超过六个小时所以 Meta 工程师可以解决这个问题。门洛帕克公司指出“错误的配置更改”其计算机服务器。事实上,一名技术人员在进行日常维护时发出了一条命令,阻止所有互联网用户访问 Meta 的数据中心。
亚马逊网络服务中断
同年,亚马逊遭遇严重失败。领先的云主机之一亚马逊网络服务(AWS)遭遇故障。近十个小时的时间里,许多网站变得无响应。 Disney+、Netflix、Tinder 或 Coinbase 等网站无法访问。亚马逊服务也是如此。根据记录,AWS 拥有超过 30% 的云托管市场份额政治家。这就是大部分网络无法访问的原因。
与OVH的比较
作为我们采访的一部分,Benoit Grunemwald 相反将 CrowdStrike 灾难与OVH 遭遇故障法国托管提供商,2021 年。斯特拉斯堡的一个数据中心发生火灾后,大量网站发现无法访问。对于 ESET France 专家来说,OVH 中断的影响比 CrowdStrike 的影响大得多。事实上,袭击 OVH 的火灾伴随着大量数据丢失。事件期间许多地点被清除。
“那些网站没有备份的人发现自己处于一个没有网站的状态,又处于两个状态,无法轻松重新启动一个网站””,伯努瓦·格鲁内瓦尔德 (Benoit Grunemwald) 解释道。
历史上独一无二的崩溃?
总之,我们可以认为 CrowdStrike 中断在计算历史上是独一无二的。 Windows 的普遍存在、错误更新的时机以及缓慢而乏味的解决过程使这成为 IT 世界中最引人注目的事件之一。
“我真的不记得影响这么多工作站的故障”ESET 法国负责人告诉我们。
然而,与 OVH 火灾等其他重大事件相比,停电的长期后果似乎有限。一旦所有电脑重新启动,企业将在此次事件中毫发无伤,尽管经济损失严重。正如伯努瓦·格鲁内瓦尔德 (Benoît Grunemwald) 指出的那样,“一旦每个职位恢复上线,就不会产生任何运营后果”。
故障发生一周后,97% 的机器受到影响CrowdStrike 表示,由于该 bug 也已重新启动。尽管更新造成了巨大的混乱,但一切都相对较快地恢复了秩序,对企业和个人的影响相当小。
Opera One - AI 驱动的网络浏览器
作者:歌剧