后跳动DeepMind的Alphago是世界上最好的GO球员,正在将另一款游戏视为扑克。问题是,它可以击败我们人类吗?
当Google开发的人工智能(AI)软件DeepMind Alphago击败Go Games的国王Lee Sedol时,许多人现在认为AIS已完成,就董事会游戏而言。尽管棋盘游戏对于复杂的超级计算机和AIS并不是什么新鲜事物 - 还记得Deep Blue吗? - GO,一种古老的中国游戏,是一个完全不同的水平,因为它更抽象。
但是,伦敦大学学院的讲师大卫·西尔弗(David Silver)也是DeepMind编程背后的一个人之一,他希望通过创建扑克机器人来进一步迈出一步。
流行的赌场游戏扑克可以为Alphago提供更明确的挑战,原因是“不完美的信息”。
除了有许多不同类型的扑克之外,桌子上只有几张牌,而不是同时揭示的。此外,要使玩家赢得比赛,他还需要知道如何解释诸如肢体语言甚至眼睛运动之类的线索。
在与大学研究专业的约翰内斯·海因里希(Johannes Heinrich深厚的增强学习。两者还参与了自我播放的AI,这意味着它与虚拟玩家一起玩游戏,以使自己在游戏中进行互动时学习。
这意味着,对于每一轮AI,它从错误中学到了,修改了其神经网络,并试图在没有直接了解对手扮演的扑克卡的情况下制定策略,就像在现实世界中一样。
结果表明,在Leduc Poker中,一个简单的扑克游戏仅涉及六张牌,该机器人达到了NASH平衡,这是游戏玩游戏的最佳方法。当谈到德克萨斯州Hold'em时,它“学习了一种竞争战略,该战略与人类专家和最先进的方法的表现有关”说[PDF]该研究。
尽管诸如AI在游戏中无法预测对手的行为之类的局限性,但现在重要的是,该系统“从头开始学习扑克游戏,而没有对游戏的任何先验知识。这也可以想象,它也适用于其他具有战略性的现实世界中的策略性问题,”说海因里希。
照片:和古德温|Flickr