按照人类的标准,国际象棋并不是一项简单的游戏。 但对于一个在一种令人敬畏的、几乎是外星人的心态的驱动下,这种微不足道的消遣可以在几个空闲时间内掌握。
在一篇新论文中,谷歌研究人员详细介绍了他们最新的人工智能进化 AlphaZero 是如何开发的“超人的表演”在国际象棋方面,只需四个小时就可以学习规则,然后就消灭了世界冠军国际象棋程序 Stockfish。
换句话说,人类所有的国际象棋知识(甚至更多知识)都被人工智能吸收并超越,时间大约与从纽约市开车到华盛顿特区所需的时间相同。
在仅使用国际象棋规则(无策略)进行编程后,AlphaZero 在短短四个小时内就掌握了这款游戏,能够超越国际象棋棋手。收视率最高下棋程序鳕鱼干。
在与 Stockfish 的一系列 100 场比赛中,AlphaZero 作为白棋(具有先发优势)赢得了 25 场比赛,并以黑棋赢得了 3 场比赛。 其余比赛均为平局,Stockfish 未获胜,AlphaZero 未负。
“我们现在知道谁是我们的新霸主了,”说国际象棋研究员 David Kramaley,国际象棋科学网站 Chessable 的首席执行官。
“毫无疑问,这将彻底改变游戏,但想想如何将其应用到国际象棋之外。这种算法可以运行城市、大陆、宇宙。”
AlphaZero 由 Google 的 DeepMind AI 实验室开发,是一个经过调整的、更通用的版本阿尔法狗零式,专门玩中国棋盘游戏围棋。
DeepMind 已经多年来不断完善这个人工智能,在此过程中超越人类冠军系列赛他们像多米诺骨牌一样倒在不屈不挠的人面前,“神一样”的神经网络。
这场连胜最终以惊人的成功十月份,一个新的完全自主版本的人工智能——它只能通过自己玩耍来学习,从不面对人类——击败了它以前的所有版本。
相比之下,AlphaGo Zero 的前辈部分是通过观看人类棋手的走棋来学习如何玩游戏的。
这一努力的目的是帮助刚刚起步的人工智能学习策略,但似乎这实际上可能是一个障碍,因为 AlphaGo Zero 的完全自力更生学习能力被证明毁灭性地更有效在一对一的比赛中。
麻省理工学院计算机科学家尼克·海因斯表示:“这就像一个外星文明发明了自己的数学。”吉兹莫多在十月。
“我们在这里看到的是一个没有人类偏见和预设的模型。它可以学习任何它认为是最佳的东西,这确实可能比我们自己的概念更加微妙。”
但这一领域的发展速度如此之快,十月份的成就可能已经过时了。
在他们的新纸,该团队概述了最新的 AlphaZero AI 如何利用自我对弈的依赖(称为强化学习),并将其应用到更广泛的领域,从而使其更广泛地关注问题解决。
这种更广泛的关注意味着 AlphaZero 不仅仅是下棋。 它还可以玩将棋(又名日本象棋)和围棋——而且,也许并不奇怪的是,它也只花了两个小时和八个小时就掌握了这些游戏。
目前,谷歌和 DeepMind 的计算机科学家尚未对这项新研究发表公开评论,该研究尚未经过同行评审。
但从目前我们所知,这种算法向人工智能巅峰的令人眼花缭乱的攀登还远没有结束,就连国际象棋大师也被眼前的景象迷惑了。
“我一直想知道,如果一个高级物种登陆地球并向我们展示他们如何下棋,那会是什么样子,”国际象棋大师彼得·海涅·尼尔森告诉英国广播公司。
“现在我明白了。”
研究结果可在预印本网站上获取arXiv。