人工智能(人工智能)被证明非常擅长某些任务? 喜欢发明人脸实际上并不存在,或者赢得扑克游戏? 但当涉及到人类自然会做的事情:想象时,这些网络仍然举步维艰。
一旦人类知道了猫是什么,我们就可以很容易地想象出一只不同颜色的猫,或者不同姿势的猫,或者不同环境中的猫。 对于人工智能网络来说,这要困难得多,尽管它们可以在看到猫时识别出猫(经过足够的训练)。
为了尝试释放人工智能的想象力,研究人员提出了一种新方法系统可以计算出一个物体应该是什么样子,即使他们以前从未真正见过一个与它完全相同的物体。
“我们受到人类视觉泛化能力的启发,尝试在机器中模拟人类的想象力,”计算机科学家葛云浩说道来自南加州大学 (USC)。
“人类可以通过属性(例如形状、姿势、位置、颜色)分离他们学到的知识,然后将它们重新组合以想象一个新的物体。我们的论文尝试使用神经网络来模拟这个过程。”
关键是外推? 能够使用大量的训练数据(例如汽车图片)来超越所见的范围,进入未见的范围。 这对于人工智能来说很困难,因为它通常被训练来发现特定的模式而不是更广泛的属性。
该团队提出的方法称为可控解缠表示学习,它使用的方法与过去使用的方法类似。创建深度赝品? 解开样本的不同部分(在深度伪造视频的情况下,将面部运动和面部身份分开)。
这意味着如果人工智能看到一辆红色汽车和一辆蓝色自行车,它就能够为自己“想象”一辆红色自行车? 即使它以前从未见过。 研究人员将其整合到一个他们称之为“小组监督学习”的框架中。
从训练数据中推断出新数据。 (伊蒂等人,2021)
这项技术的主要创新之一是按组而不是单独处理样本,并在此过程中建立它们之间的语义链接。 然后,人工智能能够识别它所看到的样本中的相似点和差异,并利用这些知识来产生全新的东西。
“这种新的解开方法第一次真正释放了人工智能系统的新想象力,使它们更接近人类对世界的理解,”南加州大学计算机科学家 Laurent Itti 说道。
这些想法不是全新的,但在这里研究人员进一步扩展了这些概念,使该方法更加灵活并且与其他类型的数据兼容。 他们还将该框架开源,以便其他科学家可以更轻松地使用它。
未来,这里开发的系统可以通过从等式中删除更敏感的属性来防止人工智能偏见? 例如,帮助建立没有种族主义或性别歧视的神经网络。
研究人员表示,同样的方法也可以应用于医学和自动驾驶汽车领域,人工智能能够“想象”新药,或者可视化过去没有经过专门训练的新道路场景。
“深度学习已经在许多领域展示了无与伦比的性能和前景,但这种情况往往是通过浅薄的模仿而发生的,并且没有更深入地了解使每个对象独一无二的单独属性,”伊蒂说。