佐治亞理工學院開發的新機器學習(ML)技術的成功測試結果可以幫助社區為極端天氣和沿海洪水做準備。該方法也可以應用於預測自然系統如何影響社會的其他模型。
博士學生Phillip SI和Peng Chen助理教授開發了潛在 - ENSF,該技術改善了ML模型同化數據以做出預測的技術。
在預測中等範圍的天氣預測和淺水波傳播的實驗中,潛在-ENSF顯示出比現有的稀疏數據同化方法更高的準確性,更快的收斂性和更高的效率。研究是出版在arxiv預印服務器。
“我們目前正在參與一個旨在提供有關佛羅里達州皮內拉斯縣極端洪水事件的實時信息的項目,”研究計算科學與工程(CSE)的SI說。
“我們正在積極地將潛在 - ENSF整合到系統中,這將促進自然災害的準確和同步建模。該計劃旨在增強社區準備和安全措施,以應對洪水風險。”
潛伏-ENSF在淺水波傳播實驗中的同化速度,準確性和效率方面優於三個可比模型。這些測試表明,模型可以對沿海洪水,潮汐和海嘯進行更好,更快的預測。
在中等範圍的天氣預報的實驗中,潛在 - ENSF在準確性,收斂性和時間上超過了相同的三個控制模型。此外,與其他方法相比,該測試證明了潛在-ENSF的可伸縮性。
這些有希望的結果支持使用ML模型模擬氣候,天氣和其他復雜系統。
傳統上,這樣的研究需要使用大型,能源密集的超級計算機。但是,諸如潛在-ENSF之類的進步使得為這些目的可行的更小,更有效的ML模型。
佐治亞理工學院的團隊在論文中提到了這種比較。歐洲中心天氣預報中心需要數小時才能運行其模擬。相反,ML模型四castnet在幾秒鐘內計算了相同的預測。

一個耦合的VAE,用於稀疏觀測和完整狀態的一致潛在表示。 ©arxiv(2024)。 doi:10.48550/arxiv.2409.00127
CSE學校的助理教授陳說:“解決,複雜性和數據多樣性將繼續增加。”
“為了跟上這一趨勢,我們認為ML模型和基於ML的數據同化方法對於研究大規模複雜系統而言是必不可少的。”
數據同化是模型不斷攝入新的現實數據以更新預測的過程。這些數據通常是稀疏的,這意味著它是有限的,不完整的或隨著時間的推移分佈不均的。
潛在-ENSF建立在集合濾波器分數(ENSF)模型由佛羅里達州立大學和橡樹嶺國家實驗室研究人員開發。
ENSF的強度是,它具有許多功能和數據點之間不可預測的關係的數據。但是,整合稀疏數據會導致模型中的信息和知識差距丟失。而且,這樣的大型模型可能會完全停止從少量稀疏數據中學習。
發現最新的科學,技術和空間100,000個訂戶依靠Phys.org進行日常見解的人。
註冊我們免費新聞通訊並獲得有關突破的最新信息,
創新和研究 - 每天或每週。
佐治亞理工學院的研究人員在潛在-ENSF中採用了兩名變異自動編碼器(VAE),以幫助ML模型集成和使用現實世界數據。 VAE在同一空間中共同編碼稀疏數據和預測模型,以更準確,更有效地吸收數據。
將模型與新方法(如潛在ENSF)相結合,可以加速數據同化。在現實世界危機期間,更快地產生準確的預測可以為社區挽救生命和財產。
為了向更廣泛的研究社區分享潛在的ENF,Chen和Si在暹羅計算科學與工程會議(CSE25)。 3月3日至7日在得克薩斯州沃思堡舉行的CSE25組織工業和應用數學協會(SIAM)。
Chen是CSE教職員工的十所學校之一,他們在CSE25進行了研究,佔該學校教職員工的三分之一。潛在 - ENSF是CSE學校作者的15篇論文之一,也是會議上介紹的佐治亞州技術論文之一。
兩人還將在即將到來的國際學習表現會議(ICLR 2025)。 ICLR於4月24日至28日在新加坡舉行,是全球最負盛名的會議之一,致力於人工智能研究。
Chen說:“我們希望通過介紹我們的論文來引起專家和領域科學家的令人興奮的基於ML的數據同化的領域。” “我們的工作提供了一種新的解決方案,以解決該領域的一些主要缺點,以實現更廣泛的應用程序。”
更多信息:
Phillip Si等人,潛伏-ENSF:具有稀疏觀察數據的高維數據同化的潛在集合評分過濾器,arxiv(2024)。doi:10.48550/arxiv.2409.00127
引用:
機器學習編碼器改善了天氣預報和海嘯預測(2025年,3月19日)