Meta 刚刚发布了 AudioCraft,这是一套人工智能驱动的工具。它由三种不同的AI模型组成,可以生成优质的音乐和音效。 Meta 已将其技术代码提供给所有人,以加快研究速度。
Meta 非常致力于人工智能竞赛,刚刚将 AudioCraft 上线,一套人工智能驱动的工具。该套房能够“轻松生成高品质音频和音乐”基于简单的文本。要制作音轨,你现在只需向人工智能描述你的想法即可。没有“需要在乐器上演奏一个音符”,门洛帕克公司在其博客上的一篇文章中强调了这一点。不再需要学习吉他、小提琴或钢琴了!
音乐、音频和压缩的三种 AI 模型
具体来说,Audiocraft 由三个 AI 模型组成。我们首先找到音乐生成器。该模型于夏初发布,可以根据由 20,000 小时授权音乐组成的数据库中的短语生成短音乐曲目。用户必须指出所需的音乐类型,提及要使用的乐器并定义乐曲必须引起听众的感受。
该模型附带 AudioGen。该工具旨在产生声音效果和声音效果。为了开发人工智能,Meta 使用了一个数据库,其中包含“公共音效”。在这里,只需写下您想要获得特定音效的内容即可。
该集团过去已经宣布过这两种人工智能模型,分别是EnCodec 辅助。该技术将音频文件分割成小块,以便于人工智能处理。最终,EnCodec 可以生成更少不需要的失真(例如咔哒声、嗡嗡声或嘶嘶声)的音乐。由于更好的压缩,结果更加清晰锐利。
通过结合这三个模型,任何人都可以通过编写描述来为电影、动漫或视频游戏生成音乐作品或获得高质量的音效。毫不奇怪,在编写文本、添加细节和指示时必须特别小心,以获得精确和令人信服的结果。 Meta 指出 AudioCraft 非常易于使用:
“与之前的工作相比,通过 AudioCraft,我们简化了音频生成模型的整体设计”。
对于 Meta 来说,AudioCraft 并不是要取代音乐家和其他音频专业人士。这家美国公司将其技术描述为“一种新型乐器——就像合成器第一次出现时一样”。
元和人工智能研究
一如既往,Meta 提供研究人员可以完全访问其模型。这一开源战略旨在鼓励人工智能研究。马克扎克伯格的团队已经做到了这一点骆驼, 儿子语言模型OpenAI 的 GPT 的替代品。该模型很快被开发人员采用,并用于创建许多不同的聊天机器人,包括可在网络上访问的未经审查的版本。
“我们正在开放对这些模型的访问,使研究人员和从业者能够首次使用自己的数据集训练自己的模型,以帮助他们推进人工智能驱动的音频和音乐领域»,Meta 在新闻稿中解释道。
近几个月来,Meta 推出了大量与人工智能相关的创新。他只有一件作品尚未可供研究。这是关于Voicebox,一种能够模仿人类声音的人工智能。该组织担心恶意个人会使用该工具来诱骗和操纵其他人。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 元