机器人革命正在进行中,甚至还在加速。就在最近,出现了第一个英伟达和艾萨克,它的机器人模拟器可以在虚拟宇宙中训练人工智能。然后,两天前,由埃隆·马斯克 (Elon Musk) 资助的非营利研究中心 OpenAI 揭开了该领域最新进展之一的面纱:一种能够像人类一样学习的机器人,通过模仿、复制“手势” 。
虚拟现实学习
显然,目前这不是一个完全相同地再现人类动作的问题。事实上,与其说机器人学习执行的动作,不如说是最终的操作本身。
为了促进学习,研究人员使用了虚拟现实。配备 HTC Vive 及其配套控制器的人类在极简虚拟环境中控制机械臂(与机器人不同)。他有条不紊地堆叠一系列彩色立方体。对于每个立方体,他移动虚拟手臂,按下按钮收紧夹具并抓住立方体,然后将其放在另一个立方体上并释放压力。
这一系列的动作和动作构成了提交给机器人的虚拟会话。或者更准确地说,是驱动它的两个人工智能中的第一个,一个负责视觉的神经网络。正是这种算法使机器人能够识别立方体,知道它如何放置在三维空间中,并知道如何与这些立方体交互以成功制作一座小塔。
显然,他之前遇到过位于虚拟环境中的数以万计的虚拟立方体图像,这些图像也显示不同的颜色、纹理或灯光。在机器人人工智能的训练阶段使用各种各样的环境,以便它能够分析来自摄像机(现实)的视频流并在其中“找到路”。
模仿和预测...
因为,由于机器人配备了摄像头,它能够识别真实的“工作”环境以及放置在其前面的真实立方体。这就是该机器人的第二个神经网络的用武之地,简称为模仿网络。
得益于第二层人工智能,它能够知道如何处理真实的立方体,无论它们的起始位置、排列方式如何,并且始终按照演示的顺序堆叠它们。
换句话说,即使立方体没有像人类演示中那样放置,人工智能也能够通过“预测”演示者动画的手臂会做什么来进行调整。她并没有愚蠢地重复一系列动作,而是吸收了立方体之间的差异、进行动作的必要性和顺序等。
惊险? OpenAI 研究人员之一乔什·托宾 (Josh Tobin) 解释说,这种人工智能确实如此,特别是因为它所做的动作与用于其“训练”的虚拟手臂的动作并不完全相同。但更不可思议的是,她只需要“看到”这个序列一次,就能模仿她所看到的,因此得名“One shot模仿学习”,一次性模仿学习。
加速机器人学习和行走
这一进步更加重要,因为它不仅限于堆叠立方体。它可以应用于各种其他情况。事实上,这是研究人员希望成功训练人工智能的一部分,这些人工智能可以通过模拟的虚拟数据驱动机器人。这种方法真正呼应了 Nvidia 的 Isaac,旨在减少深度学习所需的时间和成本。
Nvidia 希望让机器人通过迭代进行自主学习,而 OpenAI 希望找到一种方法将“知识”快速传输给机器人,让机器人知道如何适应不同的环境。“孩子生来就有模仿别人行为的能力。 [...]我们希望我们的机器人也能够以这种方式学习,”乔什·托宾解释道。
目前,这项研究显然仅处于实验阶段。但找到一种更快更好地“训练”人工智能的方法可以解决机器人崛起的两个障碍之一。剩下的就是成功克服与这些智能机器的某些外形因素相关的某些物理限制。一根稻草! C3PO 绝对不适合明天……