穩定AI的穩定音頻2.0使用戶可以從文本中創建更長的“增強”音樂

2024-04-03

穩定性AI具有發射穩定的音頻2.0，對其文本到音樂發電機的更新，為用戶提供了音樂創建中的擴展功能。新版本允許用戶以44.1 kHz的立體聲生成長達三分鐘的曲目，從而大大增強其創造力。

音頻到原告音樂的一代

穩定音頻2.0的關鍵亮點之一是其音頻到審計生成功能，該功能使用戶能夠使用基於文本的AI提示來操縱任何音頻示例。這意味著用戶現在可以將自己的音頻樣本轉換為各種各樣的聲音，從而為實驗和創造力打開了無盡的可能性。

但是，重要的是要注意，穩定性人工智能的服務條款要求上傳到平台的任何音頻都沒有受版權保護的材料。為了確保合規性，該工具採用了複雜的內容識別過濾器。

穩定音頻2.0的發射是在穩定AI的內部改動中進行的，尤其是辭職Ed Newton-Rex，公司的音頻副總裁。

牛頓 - 瑞克斯（Newton-Rex）引用了關於使用版權作品進行人工智能培訓的分歧，這是他離開的原因，強調了道德考慮在人工智能發展中的重要性。

牛頓 - 雷克斯在X上說：“很明顯，我是生成AI的支持者。它將有很多好處 - 這就是為什麼我已經從事它工作了13年了。但是，我只能支持未經培訓模型而不會通過培訓模型來替代他們的工作的生成型AI。

與市場上的其他AI模型不同，穩定的音頻和穩定的音頻2.0僅接受從音樂庫Audiosparx許可的數據進行培訓。

該庫包含超過800,000個音頻文件，包括音樂，聲音效果和單儀器詞幹以及文本元數據。包含在圖書館中的音樂家可以選擇退出訓練穩定音頻的模型。

穩定的音頻2.0建立在其前身穩定音頻1.0的成功之上，該音頻1.0被譽為之一時間的最佳發明2023。新版本提供了擴展的功能，包括具有結構化構圖的全長軌道生成，例如介紹，進度和距離，以及立體聲效果。