研究人員建立了一個新的「多元宇宙模擬」平台,可以產生大量資料來訓練先進的自學習機器人(人工智慧).
據設計該平台的英偉達稱,這套被稱為「Cosmos」的工具可以讓研究人員創建「世界基礎模型」——模擬現實世界環境和物理定律的神經網絡,以預測現實結果。這些生成式人工智慧模型可以創建合成資料來訓練例如自動駕駛汽車 (AV) 或人形機器人。
訓練人工智慧系統需要大量數據,但科學家估計我們。與現實世界互動的人工智慧系統(例如機器人)通常需要現實世界的鏡頭,而這些鏡頭的製作極其困難且獲取成本高昂。
但創建真正有用的合成數據也具有挑戰性,一項研究之前警告可能會分解成難以理解的廢話。 Cosmos 旨在透過讓科學家根據現實世界的物理原理快速產生大量人工影片片段來解決這些問題。
有關的:
“今天的人形開發人員有數百名人類操作員進行數千次重複演示,只是為了教授一些技能,”勒巴雷迪安牧師Nvidia Omniverse 和模擬技術副總裁週一(1 月 6 日)在拉斯維加斯 CES 2025 舉行的虛擬新聞發布會上表示。 「當今的AV 開發人員需要行駛數百萬英里;處理、過濾和標記捕獲的數千PB 數據甚至需要更密集的資源,而物理測試是危險的。當一個機器人原型可能花費數百美元時,人形開發人員會損失慘重。
模擬多元宇宙
這個新平台的關鍵組成部分是多元宇宙模擬,其中 Cosmos 與 Nvidia 的 Omniverse 軟體系統相結合,在特定場景下產生未來所有可能的結果。然後將其輸入機器人或自動駕駛汽車的訓練中。
它使用圖像生成中使用的擴散模型(機器學習演算法,透過向資料集中添加「雜訊」(粒度規格)然後學習消除雜訊來產生資料)以及自回歸模型,這是用於預測下一個資料的統計模型流程中的一步。總之,該平台可以接收文字、圖像或視頻,然後產生片段來即時預測特定場景中接下來會發生什麼。
「機器人技術的 ChatGPT 時刻即將到來。與大型語言模型一樣,世界基礎模型是推進機器人和 AV 開發的基礎,但並非所有開發人員都擁有培訓自己的專業知識和資源,」黃仁勳英偉達創辦人兼執行長在聲明中表示。 “我們創建 Cosmos 是為了實現物理人工智慧的民主化,並使通用機器人技術觸手可及。”
使用 Cosmos 建立的世界基礎模型也可根據開源授權條款使用。