您認為自己在Atari Games上很棒嗎?字母子公司DeepMind的新型人工智能設備稱為Agent57可能證明您錯了。該公司聲稱,其AI可以在所有57場Atari 2600場比賽中擊敗平均角色。

Agent57利用一種稱為“深鋼筋學習”的系統學習,以從錯誤中學習並在玩遊戲方面變得更好。一個學習DeepMind在周二發表的說明了為什麼遊戲是查看AI如何工作的一種非凡方法。
遊戲正在測試AI算法的測試場
研究人員認為,遊戲是建立自適應算法的絕佳測試場。該團隊說,AI提供了一系列豪華的任務,玩家必須制定複雜的行為策略來掌握。
DeepMind使用相同類型的小工具掌握來增加其AI機器的Alphago,被擊敗2016年,歷史悠久的中國比賽與李·塞多爾(Lee Sedol)的33歲大師。埃隆·馬斯克(Elon Musk)評論十年前,AI可以實現這樣的壯舉,當時Alphago贏得了對陣Sedol的第一輪比賽。
一些最具挑戰性的視頻遊戲代理57是滑雪,,,,Solaris,,,,陷阱,,,,和蒙特祖瑪的複仇。儘管其他AI結構在那些視頻遊戲中度過了艱難的時期,但Agent57的表現要比任何AI以前的能力都更好。 DeepMind的創新首次超過了普通人的整體表現。
AI發現陷阱和蒙特祖瑪的複仇由於遊戲需要大量策略的事實,具有挑戰性。Solaris和滑雪另一方面,由於兩款遊戲都需要決策技巧,因此消耗了AI的時間。
總體冠軍:代理57
總體而言,Agent57不管面臨什麼挑戰,都能超越人類。研究人員寫道,他們成功地建立了一個更普遍的智能代理,該代理商在Atari57基準中使用Agent57具有超過人類的性能。
該論文寫道:“ Agent57能夠隨著計算量的增加而擴展。”研究人員說,無疑可以提高數據效率。他們說:“儘管這使Agent57能夠實現強大的一般性能,但它需要大量的計算和時間。”
Atari 2600於1977年發行,並在1980年的幫助下出售了數十萬個遊戲機。 Atari永遠改變了遊戲,其遊戲保持著巨大的粉絲群。儘管使用世界各地的人們,但仍在使用標誌性的視頻遊戲,例如陷阱! ,導彈命令,太空入侵者,小行星等。
元
為了應對挑戰,Agent57匯集了DeepMind對其Deep-Q網絡進行的多次升級,AI首次在2012年擊敗了一些Atari遊戲。
但是,今天世界上最好的深度學習模型是不太通用儘管他們的所有成功。培訓AI以超過一個任務的表現是深入研究的最大開放挑戰之一。
雖然Agent57可以發現玩57場視頻遊戲的方法,但它不能多任務或繼續玩所有57個視頻遊戲。 AI希望為每個新遊戲進行重新訓練,即使它可能會使用相同的算法來進行。真正的多功能性對人類嬰兒沒有問題,它仍然是AI的範圍很長的路。