OpenAI 是一家专门从事人工智能研究的公司,将在下一场重大国际电子竞技赛事中派出自己的选手团队。除了没有人类会加入其队伍之外:只有由人工智能控制的机器人才能工作。该团队被称为 OpenAI Five。当然,她不会参加正式比赛,而是参加几场表演赛,与真正的职业选手进行比赛,试图让他们落败。
Valve 每年都会举办(今年在温哥华市),国际这场比赛专门针对 MOBA(多人在线竞技场),奖金池(目前超过 1560 万美元)主要由 DoTA 玩家社区 2 资助。在为期五天的活动中,粉丝们看到了他们最喜欢的来自世界各地的球队参加 2017 年 OpenAI 的 5 对 5 比赛。已经邀请自己参加 Valve 活动,组织了一场 AI 和职业选手之间的一对一比赛。并且赢了。今年,该公司已通过第二名。
相当于对 900 年游戏的观察和分析
OpenAI 努力确保其 2017 年推出的 AI 能够管理的不仅仅是 1 个角色,而是 5 个角色。最重要的是,让它们在游戏地图上一起进化,尽可能明智地使用能力和物体。为此,OpenAI 使用了所谓的“强化”学习方法,旨在从具体元素中训练人工智能。在我们的例子中,业余玩家和职业玩家都玩游戏。
总的来说,这些算法每天与自己玩的游戏相当于 180 年(或者 5 个英雄玩 900 年)。这是为了培养凝聚力、团队精神、掌握游戏机制的微妙之处(最后一击或打了就跑例如)以及结合角色攻击的能力。
作为“培训室”,人工智能使用了内部系统(近端策略优化)需要 256 个图形处理器和 128,000 个处理器内核才能满负荷运行。
理论培训结束后,进行实际操作
为了测试 OpenAI 5 的进展并找出其弱点,OpenAI 在几个月的时间里在几次私人或公共活动的背景下与多个人类团队进行了对抗。
因此,AI 面临的挑战包括:例如,在 OpenAI 内部运营的最佳 DoTA 玩家,甚至除了玩家/评论员 Blitz 之外还从公众中选出的玩家。
然后是由 Valve 员工组成的团队、业余团队,最后是与人工智能竞争的半职业团队。当然,要玩的游戏角色是预先定义的(镜像匹配),游戏过程中要遵守的规则也是预先定义的(例如禁止使用某些物体或能力)。尽管人工智能一开始输掉了几场比赛,但它很快就赢得了几场比赛,一周又一周,甚至对阵半职业选手。整个体验可以在门票上找到d'OpenAI 博客。
如果您是 DoTA 2 粉丝或者只是对 OpenAI 的 AI 能够实现的壮举感到好奇,请知道在国际邀请赛(将于 8 月 20 日至 25 日举行)之前,OpenAI 计划了一场与职业选手一线队的热身赛。将于 7 月 28 日举行,后续可在完整 Twitch公司的,或者,如果您当时在旧金山居住或度假,您可以尝试获得邀请函亲自参加。
资料来源:
OpenAI 通过纽温