網路安全巨頭 CrowdStrike 是全球 Windows 宕機事件的幕後黑手。該事件被廣泛描述為計算史上最大規模的中斷。但是,事實真的是這樣嗎?我們盤點一下。
2024 年 7 月 19 日星期五,全球 IT 產業陷入困境。上午的時候,數百萬台 Windows 計算機開始顯示著名的藍色畫面死機。據微軟稱,超過 800 萬台機器無法訪問,導致世界各地的營運商、電視頻道、航空公司和醫院陷入癱瘓。
很快就清楚了由 CrowdStrike 部署的更新與微軟合作的網路安全巨頭是這場混亂的幕後黑手。顯然,該公司在沒有進行任何測試的情況下就推出了 Falcon 的更新,該公司的防毒軟體已整合到 Windows 中。 CrowdStrike 聲稱其基於雲端的測試系統遇到了錯誤。這導致了部署“更新有問題”。儘管 CrowdStrike 在漏洞發生後不到兩小時內就回滾了修補程式的發布,但數百萬台電腦已經下載並安裝了該更新。
史上最嚴重的崩潰?
部署當天,錯誤的 CrowdStrike 更新導致真正的地震在某些活動部門。週末航空公司被迫取消數千個航班。在美國,有3000多架飛機無法起飛。這次中斷造成的巨大影響部分是由於Windows在電腦上無所不在,尤其是在專業領域的機器上。事實上,全球有不到 70% 的電腦安裝了微軟的作業系統,據透露政治家。
Semperis 技術專家 Guido Grillenmeier 在對 01Net 的回應中強調,停電的影響類似於“精心策劃的供應鏈攻擊”。專家將 CrowdStrike 災難的後果與 SolarWinds、Kaseya 和 NotPetya 等著名攻擊的後果進行了比較。據他介紹,“對受害者的影響是相同的”。
ESET France 公共事務總監 Benoit Grunemwald 在接受 01Net 採訪時並未認同此一觀點。對網路安全專家來說,中斷的後果並不嚴重不常見的措施與網路攻擊有關。
「表面上看是類似的,但是修復還是很快的。例如,如果您的勒索軟體導致 10,000 台或 100,000 台機器損失慘重,那麼您不會因為回到過去而在兩天內離開。,我們的對話者說。
一場財務災難
不出所料,這起事件引發了失去一筆財富受影響的企業。根據大型保險公司 Parametric 估計,Windows 故障導致財富 500 強企業損失高達 54 億美元的收入和毛利,專門從事網路安全的保險僅涵蓋此類故障造成的損失的 10% 至 20%。
醫療保健公司、銀行和航空公司因 CrowdStrike 中斷而遭受的損失最為嚴重。根據 Parametric 估計,由於防毒更新錯誤,醫療保健巨頭損失了近 20 億美元。同時,銀行業損失超過 10 億美元,而六家財富 500 強航空公司的損失為 8.6 億美元。
距離完全康復還有幾週?
此外,CrowdStrike 中斷的特點首先在於解決時間特別長。僅僅部署 Falcon 防毒修補程式來讓一切恢復正常是不夠的。要解決中斷問題,IT 管理員必須手動通過在每台受影響的機器上。正如 Forrester 副總裁兼首席分析師 Andras Cser 所解釋的那樣:“解決這個問題需要付出相當大的努力”。即使使用微軟提供的復原工具,這項任務也非常繁瑣。
「由於更新的部署方式,受影響機器的恢復選項是手動的,因此受到限制:管理員必須將實體鍵盤連接到每個受影響的系統,啟動到安全模式,刪除受感染的CrowdStrike 更新,然後重新啟動””,Andras Cser 解釋道。
這事件迫使受影響的公司分配大量人力資源。在這樣的背景下,這個問題就更加成問題了缺乏合格的勞動力在 IT 和網路安全領域。這是美國眾議院在致 Crowdstrike 執行長 George Kurtz 的傳票信。在我們的訪談中,Benoît Grunemwald 也指出了影響整個 IT 產業的勞動力短缺問題:
「我認為,無論如何,在網路世界中,我們已經看到勞動力短缺有一段時間了,因此,在我看來,這種勞動力短缺尤其在這個假期期間感受到的說法似乎並沒有誤導。
Le 計時你的bug災難的規模也起到了一定的作用。事情發生在暑假中期,週末之前。正如 Forrester 首席分析師 Allie Mellen 所指出的那樣,“週五晚上,當人們回家過週末時,一些地區發生了乾擾。”事實上,不一定有工作人員可以做出有效反應。
之前影響 IT 的中斷
為了更了解 CrowdStrike 故障對全球造成的影響,我們回顧了 IT 歷史上曾經發生過的故障。近年來,許多數位巨頭發現自己陷入了與微軟和CrowdStrike相同的境地。
Facebook、Instagram 和 WhatsApp 無法訪問
讓我們先提一下2021年底發生的Meta宕機事件。我不得不等待超過六小時所以 Meta 工程師可以解決這個問題。門洛帕克公司指出“錯誤的配置變更”其電腦伺服器。事實上,一名技術人員在進行日常維護時發出了一條命令,阻止所有網路使用者存取 Meta 的資料中心。
亞馬遜網路服務中斷
同年,亞馬遜遭遇嚴重失敗。領先的雲端主機之一亞馬遜網路服務(AWS)遭遇故障。在近十個小時的時間裡,許多網站變得無響應。 Disney+、Netflix、Tinder 或 Coinbase 等網站無法存取。亞馬遜服務也是如此。根據記錄,AWS 擁有超過 30% 的雲端託管市場份額政治家。這就是為什麼大部分網路無法存取的原因。
與OVH的比較
作為我們採訪的一部分,Benoit Grunemwald 相反地將 CrowdStrike 災難與OVH 遭遇故障法國託管提供商,2021 年。對於 ESET France 專家來說,OVH 中斷的影響比 CrowdStrike 的影響大得多。事實上,襲擊 OVH 的火災伴隨著大量資料遺失。事件期間許多地點被清除。
“那些網站沒有備份的人發現自己處於一個沒有網站的狀態,又處於兩個狀態,無法輕鬆重新啟動一個網站””,伯努瓦·格魯內瓦爾德 (Benoit Grunemwald) 解釋道。
歷史上獨一無二的崩潰?
總之,我們可以認為 CrowdStrike 中斷在計算歷史上是獨一無二的。 Windows 的普遍存在、錯誤更新的時機以及緩慢而乏味的解決過程使這成為 IT 世界中最引人注目的事件之一。
“我真的不記得影響這麼多工作站的故障”ESET 法國負責人告訴我們。
然而,與 OVH 火災等其他重大事件相比,停電的長期後果似乎有限。一旦所有電腦重新啟動,企業將在事件中毫髮無傷,儘管經濟損失嚴重。正如伯努瓦·格魯內瓦爾德 (Benoît Grunemwald) 指出的那樣,“一旦每個職位恢復上線,就不會產生任何營運後果”。
故障發生一週後,97% 的機器受到影響CrowdStrike 表示,由於該 bug 也已重新啟動。儘管更新造成了巨大的混亂,但一切都相對較快地恢復了秩序,對企業和個人的影響相當小。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇