看到巴拉克·歐巴馬(Barack Obama)的演講影片並不令人感到驚訝,除非該影片根本不存在。華盛頓大學的研究人員設法從簡單的錄音中製作出美國前總統的視頻,下面的結果相當令人驚訝。
研究人員使用人工智慧,更具體地說是神經網絡,將奧巴馬的兩次訪談中的嘴唇與音訊來源同步,其中一次是 1990 年的。創造了一個完全逼真的嘴。然後將這張嘴疊加在歐巴馬現有的影片上,透過頭部或下巴運動等修正來達到最終結果。下面的影片更詳細地展示了該過程,並與面對面,去年提出了不同的方法。
這個過程尚未完全完美,我們有時會注意到影片中出現抖動效果。儘管如此,該技術還是很有前途的,例如可以用於視頻對話(Skype、Hangouts),如果頻寬太低,則不再需要發送圖像,而音訊傳輸足以使對話者說話。問題是需要有足夠的視訊時間來預先訓練人工智慧,儘管研究人員表示可以減少所需的數量。
當然,這樣的過程可能會因製作名人的虛假影片而受到濫用,名人甚至可以透過將華盛頓大學的技術與琴鳥,一種能夠模仿現有人的人工聲音。足以打開更多的大門假新聞。
來源 :恩傑特