看到巴拉克·奥巴马(Barack Obama)的演讲视频并不令人感到惊讶,除非该视频根本不存在。华盛顿大学的研究人员设法从简单的录音中制作出美国前总统的视频,下面的结果相当令人惊讶。
研究人员使用人工智能,更具体地说是神经网络,将奥巴马的两次采访中的嘴唇与音频源同步,其中一次是 1990 年的。人工智能的训练需要不少于 14 小时的前者的视频总统创造了一个完全逼真的嘴巴。然后将这张嘴叠加在奥巴马现有的视频上,通过头部或下巴运动等修正来达到最终结果。下面的视频更详细地展示了该过程,并与面对面,去年提出了一种不同的方法。
该过程尚未完全完美,我们有时会注意到视频中出现抖动效果。尽管如此,该技术还是很有前途的,例如可以用于视频对话(Skype、Hangouts),如果带宽太低,则不再需要发送图像,而音频传输足以使对话者说话。 。问题是需要有足够的视频时间来预先训练人工智能,尽管研究人员表示可以减少所需的数量。
当然,这样的过程可能会因制作名人的虚假视频而受到滥用,名人甚至可以通过将华盛顿大学的技术与琴鸟,一种能够模仿现有人的人工声音。足以打开更多的大门假新闻。
来源 :恩杰特