爱好者星际争霸2,擦干眼泪吧!的统治人族著名的暴雪游戏刚刚结束。掌权的不是神族,也不是虫族——这使我们免遭凯瑞甘的报复——而是 DeepMind AlphaStar,来自 Alphabet 研究部门的新型人工智能 (AI)。一个击倒了 Dario Wünsch(“TLO”)和 Grzegorz Komincz(“MaNa”)的“大脑”,据 Kotaku 报道。
阅读:DeepMind 的 AI 如何在 40 天内在围棋比赛中所向披靡
即时战略(RTS)游戏给人工智能带来了许多挑战。尽管她不需要移动鼠标,但从战术角度来看,她面前的游戏比国际象棋或围棋还要复杂。
游戏有三个派系,每个派系都包含具有独特特征的单位(射程、伤害、抵抗、速度、陆地或空中、是否具有特殊能力等)。这些部队在比具有地形和地形特征的“简单”游戏板复杂得多的地图上作战。
为了了解游戏的运作方式,DeepMind 训练了由中央人工智能精心安排的五种智能(通过监督和强化学习)。因此,这是我们必须面对玩家的五个“实验”,AI在一周的训练中以加速模式积累了不下两个世纪的游戏。面对如此大量的数字技术,人类已经放弃了。但不仅是因为处理器的强大功能,而且确实是机器的专有技术击败了它们。
受到与人类相同的限制,例如战争迷雾(玩家只能看到其单位已经访问和占领的区域),DeepMind AlphaStar 并没有因为雪崩般的行动而取得胜利——这是一种可能的情况,因为数字机器可以执行每秒数十亿次操作。
在分析结果时,研究人员发现机器实际上每分钟执行的操作数(OPM)比人类少。该机器获胜归功于更好的宏观决策(总体策略)和麦克风(单位的单独管理,特别是在战斗中,编者注)”,据 Deepmind 团队报道。
两名人类玩家和 DeepMind AlphaStar 之间的对决导致了 10 比 1 的比分,这是“Mana”赢得的唯一人类得分,这要归功于对特殊 AI 的限制,这是人为限制程序版本的顺序迫使他专注于某一领域。正如 Slashgear 指出的那样,机器之所以会失败,是因为机器没有接受过这种限制的训练。没有了链条,DeepMind Alpha Star 是星际争霸 II 的绝对高手。是什么促使暴雪在其游戏中添加第四个派系?
来源 :
Deepmind 博客