DeepMind 的新 AI AlphaStar 碾压星际争霸 II 职业玩家

2019-01-25

爱好者星际争霸2，擦干眼泪吧！的统治人族著名的暴雪游戏刚刚结束。掌权的不是神族，也不是虫族——这使我们免遭凯瑞甘的报复——而是 DeepMind AlphaStar，来自 Alphabet 研究部门的新型人工智能 (AI)。一个击倒了 Dario Wünsch（“TLO”）和 Grzegorz Komincz（“MaNa”）的“大脑”，据 Kotaku 报道。

阅读：DeepMind 的 AI 如何在 40 天内在围棋比赛中所向披靡

即时战略（RTS）游戏给人工智能带来了许多挑战。尽管她不需要移动鼠标，但从战术角度来看，她面前的游戏比国际象棋或围棋还要复杂。
游戏有三个派系，每个派系都包含具有独特特征的单位（射程、伤害、抵抗、速度、陆地或空中、是否具有特殊能力等）。这些部队在比具有地形和地形特征的“简单”游戏板复杂得多的地图上作战。
为了了解游戏的运作方式，DeepMind 训练了由中央人工智能精心安排的五种智能（通过监督和强化学习）。因此，这是我们必须面对玩家的五个“实验”，AI在一周的训练中以加速模式积累了不下两个世纪的游戏。面对如此大量的数字技术，人类已经放弃了。但不仅是因为处理器的强大功能，而且确实是机器的专有技术击败了它们。

受到与人类相同的限制，例如战争迷雾（玩家只能看到其单位已经访问和占领的区域），DeepMind AlphaStar 并没有因为雪崩般的行动而取得胜利——这是一种可能的情况，因为数字机器可以执行每秒数十亿次操作。
在分析结果时，研究人员发现机器实际上每分钟执行的操作数（OPM）比人类少。该机器获胜归功于更好的宏观决策（总体策略）和麦克风（单位的单独管理，特别是在战斗中，编者注）”，据 Deepmind 团队报道。

两名人类玩家和 DeepMind AlphaStar 之间的对决导致了 10 比 1 的比分，这是“Mana”赢得的唯一人类得分，这要归功于对特殊 AI 的限制，这是人为限制程序版本的顺序迫使他专注于某一领域。正如 Slashgear 指出的那样，机器之所以会失败，是因为机器没有接受过这种限制的训练。没有了链条，DeepMind Alpha Star 是星际争霸 II 的绝对高手。是什么促使暴雪在其游戏中添加第四个派系？

来源：
Deepmind 博客

🔴为了不错过任何01net新闻，请关注我们谷歌新闻等WhatsApp。

相關貼文