Meta 剛剛發布了 AudioCraft,這是一套由人工智慧驅動的工具。它由三種不同的AI模型組成,可以產生優質的音樂和音效。 Meta 已將其技術代碼提供給所有人,以加快研究速度。
Meta 非常致力於人工智慧競賽,剛剛將 AudioCraft 上線,一套由人工智慧驅動的工具。該套房能夠“輕鬆生成高品質音訊和音樂”基於簡單的文字。要製作音軌,你現在只需向人工智慧描述你的想法即可。沒有“需要在樂器上演奏一個音符”,門洛帕克公司在其部落格上的一篇文章中強調了這一點。不再需要學吉他、小提琴或鋼琴了!
音樂、音訊和壓縮的三種 AI 模型
具體來說,Audiocraft 由三個 AI 模型組成。我們先找到音樂產生器。該模型於夏初發布,可以根據由 20,000 小時授權音樂組成的資料庫中的短語生成短音樂曲目。使用者必須指出所需的音樂類型,提及要使用的樂器並定義樂曲必須吸引聽眾的感受。
該模型附帶 AudioGen。該工具旨在產生聲音效果和聲音效果。為了開發人工智慧,Meta 使用了一個資料庫,其中包含“公共音效”。在這裡,只需寫下您想要獲得特定音效的內容即可。
該集團過去已經宣布過這兩種人工智慧模型,分別是EnCodec 輔助。該技術將音訊檔案分割成小塊,以便於人工智慧處理。最終,EnCodec 可以產生更少不必要的失真(例如咔噠聲、嗡嗡聲或嘶嘶聲)的音樂。由於更好的壓縮,結果更加清晰銳利。
透過結合這三個模型,任何人都可以透過編寫描述來為電影、動漫或電玩遊戲生成音樂作品或獲得高品質的音效。毫不奇怪,在編寫文字、添加細節和指示時必須特別小心,以獲得精確和令人信服的結果。 Meta 指出 AudioCraft 非常容易使用:
“與之前的工作相比,透過 AudioCraft,我們簡化了音訊生成模型的整體設計”。
對 Meta 來說,AudioCraft 並不是要取代音樂家和其他音訊專業人士。這家美國公司將其技術描述為“一種新型樂器——就像合成器第一次出現時一樣”。
元和人工智慧研究
一如既往,Meta 提供研究人員可以完全存取其模型。這項開源策略旨在鼓勵人工智慧研究。馬克祖克柏的團隊已經做到了這一點駱駝, 兒子語言模型OpenAI 的 GPT 的替代品。該模型很快就被開發人員採用,並用於創建許多不同的聊天機器人,包括可在網路上存取的未經審查的版本。
「我們正在開放對這些模型的訪問,使研究人員和從業者能夠首次使用自己的數據集訓練自己的模型,以幫助他們推進人工智能驅動的音頻和音樂領域»,Meta 在新聞稿中解釋。
近幾個月來,Meta 推出了大量與人工智慧相關的創新。他只有一件作品尚未可供研究。這是關於Voicebox,一種能夠模仿人類聲音的人工智慧。該組織擔心惡意個人會使用該工具來誘騙和操縱其他人。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇
來源 : 元