繼在圖像(Dall-E、Stable Diffusion)或文字(Chat GPT)領域取得成功後,AI 正在透過 Google 的 MusicLM 展示其在音樂領域的創造力。但谷歌仍然保持謹慎態度,不向公眾提供任何對其工具的訪問權限。害怕打開潘朵拉魔盒?
圖片,然後是文字和對話,今天是音樂! AI模型的展示層出不窮,變得越來越複雜,今天最受關注的是Google的MusicLM模型。與它的姐妹 Dall-E 和圖像穩定擴散一樣,人工智慧基於文字形式的請求為您創作音樂。如果說過去已經設計過這樣的模型,那麼這裡的「高保真」品質在渲染方面就實現了飛躍。還有可信度和多樣性。在這個專門針對 MusicLM 的頁面上,Google 搜尋者會分享許多有相關查詢的音樂片段。除了風格的多樣性之外,有必要強調要求的性質:短曲、長曲、按流派劃分(故事模式),甚至是受名畫描述啟發而對已知曲調或作品進行變奏。
透過花一點時間聆聽其中幾個“創作”,一些觀察結果似乎是顯而易見的。一方面,某些作品,尤其是電子作品,顯然處於人類製作的水平。那麼,如果AI仍然有能力在鋼琴上製作“麵包”(請參閱“文字和旋律調節», 專欄 « 美麗的你好 –嗡嗡聲»,「鋼琴獨奏」線),聲音的建構和生成(特別是在音色方面)取得了巨大進步。如果模型不拘泥於某種語言,那麼這個例子“慢節奏、貝斯和鼓主導的雷鬼歌曲。持續的電吉他。帶有鈴聲的高音手鼓。聲音輕鬆有一種悠閒的感覺,很有表現力。» 在章節 «從豐富的字幕生成音頻» 令人印象深刻。透過長而非常精確的描述,人工智慧能夠創作出一首真實、可信的歌曲,其中有人類的演唱。我們認為,這個例子說明了為什麼與我們已經提到的人工智慧不同,目前不可能與該人工智慧「玩耍」的原因之一。
音樂市場潛在的地震?
繪畫領域的藝術家正在崛起,Dall-E 和 Stable Diffusion 等人工智慧設計師實際上已經在仍然在世的藝術家的整個創作上訓練了他們寶貴的演算法。這一切都是為了讓像你和我這樣的人能夠用兩句話再現一位藝術家的風格,這位藝術家有時不僅花費一生完善他的藝術,而且完善他的視覺身份。這場可能導致嚴厲的法律修正的運動,以及抄襲、作弊和其他學術「修補」的例子呈爆炸式增長的 Chat-GPT 的例子,一個強大的音頻工具的到來足以迫使谷歌保留一個(非常)冷靜的頭腦。
另請閱讀: 這個免費的人工智慧只有一個目標:破解受版權保護的圖像(2023 年 1 月)
因為音樂領域的可能性範圍和潛在的濫用與圖像領域一樣巨大。除了創造聲音身分、音樂背景、背景音樂等的市場的削弱(甚至破壞)之外。抄襲或「強烈靈感」可能會引發一位或多位知名藝術家的憤怒,這種風險可能很高。如果 OpenAI 準備透過 Dall-E 和 Chat-GPT 來「擾亂市場」以吸引投資者(如微軟),那麼像谷歌這樣的龐然大物就肩負著更多的責任和壓力。研究論文中清楚地理解和解釋了責任「Music LM:從文字生成音樂」(英文文章):«我們強烈強調未來需要進行更多工作來解決與音樂生成相關的風險——我們現階段不打算發布任何模型»。簡而言之:Google不想打開潘朵拉魔盒。只有較小的參與者且風險較小“ 公司的 ”買得起...
另請閱讀:「它沒有什麼革命性的」:法國人工智慧先驅 Yann LeCun 對 ChatGPT 不感興趣(2023 年 1 月)
從邏輯上講,有人會這麼做!隨著Google等公司的大量出版物,許多音樂模型現在成為深入研究的主題。如果威脅對音樂生態系統很重要,那麼承諾對世界其他地區也同樣重要。無論是公司創造獨特、免版稅的電話等待音樂的能力,還是為獨立視訊遊戲快速輕鬆地生成聲音和音樂的能力,等等。人工智慧顯然最終將撼動音樂創作市場。問題是法律框架是否能夠管理它的到來,或者它是否會像新的浪潮一樣發揮作用。在一個已經看到很多的部分。
來源 : 邊緣