索尼的大旅游是有史以来最大的赛车游戏系列之一,已售出超过8000万份全球。但这数百万玩家中没有一个是最快的。
索尼人工智能 (Sony AI) 领导的团队取得了新的突破(AI) 研究部门 – 开发了一个完全人工的玩家,由,不仅能够学习和掌握游戏,还能超越世界上最好的人类玩家。
人工智能代理,称为索菲GT赛车, 用过的深度强化学习练习游戏(赛车运动版版),一次控制最多20辆车,以加速数据收集并完善自身改进。
经过几个小时的学习如何控制游戏的物理原理(掌握如何应用速度和制动以最好地保持在赛道上)后,AI 的速度比参考数据集中 95% 的人类玩家还要快。
GT Sophy 不甘落后于那令人讨厌的 5%,加倍努力。
“它又进行了 9 天或更长时间的训练,累计了超过 45,000 个小时的驾驶时间,缩短了十分之几秒,直到它的单圈时间不再提高,”团队解释说在一篇描述该项目的新研究论文中。
“通过这种训练程序,GT Sophy 在所有三个赛道上都实现了超人的计时赛表现……平均单圈时间大约等于人类单圈最佳记录。”
这远不是我们第一次看到人工智能学会如何在游戏中击败人类玩家。多年来,征服的事物不断堆积,不同的特工们都在研究如何在各种游戏中击败凡人。
雅达利,棋,星际争霸,扑克, 和去也许一切都是由人的双手设计的,但人的手不再是最擅长演奏它们的了。
当然,这些游戏要么都是策略型游戏,要么玩法相对简单(以雅达利游戏为例)。大旅游– 不仅被粉丝称赞为一款视频游戏,而且还被视为一款逼真的驾驶模拟器 – 是一种不同的野兽。
研究人员表示:“人工智能的许多潜在应用涉及在与人类交互的同时在物理系统中做出实时决策。”在他们的学习中写下。
“赛车是这些条件的一个极端例子;驾驶员必须执行复杂的战术动作来超越或阻挡对手,同时在牵引力极限下操作车辆。”
然而,对于《GT Sophy》的测试来说,挑战不仅仅在于掌握游戏的战术和牵引力。人工智能还必须在赛车礼仪方面表现出色——学习如何在体育精神原则下击败对手、尊重其他车辆的行驶路线并避免发生过错碰撞。
最终,这一切都被证明不是问题。在 2021 年举行的一系列赛车赛事中,人工智能与一些世界上最优秀的选手较量大旅游球员中,包括三届冠军宫园琢磨。
在 7 月份的一场比赛中,人工智能在计时赛中击败了人类选手,但在正面交锋中并未获胜。经过研究人员的一些优化,智能体学会了如何进一步提高其性能,并在 10 月份的复赛中轻松获胜。
尽管取得了这些成就,GT Sophy 的发明者承认人工智能还有许多领域需要改进,特别是在战略决策方面。
即便如此,在有史以来最先进的赛车游戏之一中,它已经是比我们中最好的车手更好的车手了。
这对未来意味着什么仍然未知,但很有可能有一天,这样的系统可以用来控制现实世界的车辆,其操控性比专业的人类驾驶员更好。在虚拟世界中,它已经存在了。
“模拟赛车是一个需要在高度真实、复杂的物理环境中进行实时、连续控制的领域,”研究人员得出结论。
“GT Sophy 在这种环境下的成功首次表明,训练出比各种汽车和赛道类型的顶级人类赛车手更好的人工智能代理是可能的。”
研究结果报告于自然。