Microsoft创建的人工智能系统在1980年代街机游戏中取得了完美的分数Pacman女士,这个目标长期以来一直躲避游戏玩家。
这项壮举是由马鲁巴(Maluuba)完成的深度学习创业那个微软于今年年初购买。该团队使用了一种分裂和纠纷方法,该方法可能对如何教导人工智能系统具有重大影响来代替人类进行复杂的任务。
Microsoft AI在'女士中得分999,990。帕克曼'
来自Maluuba的Microsoft研究人员的人工智能系统创建能够播放Atari 2600版本的Pacman女士完美无瑕,达到999,990的最高分数。
即使经过多年的尝试,人类游戏玩家也没有实现这一壮举。人类有史以来最高的分数到达在Atari 2600版本中Pacman女士为266,330,只有使用备忘代码才能获得999,990的完美分数。
根据麦吉尔大学计算机科学副教授Doina Precup的说法,完美的分数是人工智能领域的重要成就,因为Pacman女士对于该技术来说是一个非常困难的游戏。Pacman女士被编程为不太可预测比原来的Pac-Man以这样的方式设计的,以便玩家不断丢下四分之一以击败高分。
AI如何击败女士。 Pac-Man'?
通往Pacman女士完美的分数要求研究人员将掌握街机游戏的任务分为小块,然后将其分配给150多个人工智能代理。
这种方法由Maluuba团队命名为混合奖励架构,使代理商共同努力,以取得完美的成绩Pacman女士。虽然一些代理商因寻找特定的颗粒而获得了奖励,但另一些代理商则致力于保持与鬼魂的距离。团队随后创建了一个顶级代理商,该代理商收到了所有其他代理商的建议,并决定在哪里Pacman女士应该移动。
顶级代理商考虑了推进建议的代理人的数量,但也根据建议的强度做出了决定。一个给出的例子是,当100名特工想正确地拿起小球时,有三名特工想朝另一个方向逃脱鬼魂。顶级代理人将给三个代理人增加重量Pacman女士不会被抓住。
训练AI系统的视频游戏
使用视频游戏训练人工智能系统并不是什么新鲜事。
2015年2月,一份报告显示,Google的DeepMind人工智能系统能够学习如何玩旧游戏在Atari 2600上,只需观看人类的比赛。 Deep Q-Network是由DeepMind Technology提供支持的AI游戏玩家,能够扮演49个不同的游戏,并在20多场比赛中击败了熟练的人类游戏玩家。
2016年11月,在古老的棋盘游戏中击败韩国世界冠军李·塞多尔(Lee Sedol)之后,DeepMind提出了一个更大的挑战,试图尝试掌握Starcraft II。
最终,建立人工智能系统的目标是协助人类完成其任务,在某些情况下取代他们,以便人类可以专注于其他活动。谁知道Pacman女士会以某种方式参与这样的努力吗?