愛好者星海爭霸2,擦乾眼淚吧!的統治人族著名的暴雪遊戲剛結束。掌權的不是神族,也不是虫族——這使我們免於凱瑞甘的報復——而是 DeepMind AlphaStar,來自 Alphabet 研究部門的新型人工智慧 (AI)。一個擊倒了 Dario Wünsch(“TLO”)和 Grzegorz Komincz(“MaNa”)的“大腦”,據 Kotaku 報道。
閱讀:DeepMind 的 AI 如何在 40 天內在圍棋比賽中所向披靡
即時戰略(RTS)遊戲為人工智慧帶來了許多挑戰。儘管她不需要移動滑鼠,但從戰術角度來看,她面前的遊戲比國際象棋或圍棋還要複雜。
遊戲有三個派系,每個派係都包含具有獨特特徵的單位(射程、傷害、抵抗、速度、陸地或空中、是否具有特殊能力等)。這些部隊在比具有地形和地形特徵的「簡單」遊戲板複雜得多的地圖上作戰。
為了了解遊戲的運作方式,DeepMind 訓練了由中央人工智慧精心安排的五種智慧(透過監督和強化學習)。因此,這是我們必須面對玩家的五個“實驗”,AI在一周的訓練中以加速模式積累了不下兩個世紀的遊戲。面對如此大量的數位技術,人類已經放棄了。但不僅是因為處理器的強大功能,而且確實是機器的專有技術擊敗了它們。
受到與人類相同的限制,例如戰爭迷霧(玩家只能看到其單位已經訪問和佔領的區域),DeepMind AlphaStar 並沒有因為雪崩般的行動而取得勝利——這是一種可能的情況,因為數字機器可以執行每秒數十億次操作。
在分析結果時,研究人員發現機器實際上每分鐘執行的操作數(OPM)比人類少。這台機器獲勝歸功於更好的宏觀決策(整體策略)和麥克風(單位的單獨管理,特別是在戰鬥中,編者註)”,據 Deepmind 團隊報導。
兩名人類玩家和 DeepMind AlphaStar 之間的對決導致了 10 比 1 的比分,這是「Mana」贏得的唯一人類得分,這要歸功於對特殊 AI 的限制,這是人為限製程序版本的順序迫使他專注於某一領域。正如 Slashgear 指出的那樣,機器之所以會失敗,是因為機器沒有接受過這種限制的訓練。沒有了鏈條,DeepMind Alpha Star 是星海爭霸 II 的絕對高手。是什麼促使暴雪在遊戲中加入第四個派系?
來源 :
Deepmind 博客