在图像领域的成功(DALL-E,稳定扩散)或文本(CHAT GPT)之后,AI通过Google Musiclm在音乐领域展示了其创造力。但是Google仍然谨慎,无法向公众提供对其工具的访问。因为担心打开潘多拉的盒子吗?
图像,然后是文字和对话以及今天的音乐! AI模型的演示相互关注并变得更加复杂,如今,Google的Musiclm模型引起了人们的关注。像姐妹dall-e和对图像的稳定扩散一样的AI基于文本形式的请求来构成音乐片段。如果过去已经设计了这样的模型,那么这里的质量“高保真”就在渲染方面跃升了。以及信誉和多样性。在此页面上专门针对Musiclm,Google研究人员分享了许多音乐提取物,并提供了相关请求。除了各种样式外,还必须强调请求的性质:短而长的零件,以类型(故事模式)进行分割,甚至是受到著名绘画描述启发的已知音乐或作品的变化。
通过花一点时间听这些“创作”,一些观察似乎很明显。一方面,有些碎片,尤其是电子,显然是在人类生产的水平上。然后,如果AI总是能够在钢琴上制作“面包”(请参阅”文字和旋律条件»,专栏«贝拉你好 - 嗡嗡作响“,“钢琴独奏”),在声音的构造和产生中取得了巨大进展(尤其是在邮票级别)。如果该模型有一个很大的理由坚持使用一种语言,则“示例”缓慢的节奏,低音和drums主导的雷鬼歌。持续的电吉他。高音调的Bongos,带有铃声。人声以悠闲的感觉放松,非常富有表现力。“在该部分”富有标题的音频发电令人印象深刻。从非常具体的描述中,AI可以用其中的人类歌曲制作真正的可信作品。在我们看来,一个例子说明了为什么与我们已经提到的AI不同的原因之一,与此AI“播放”的时间不可能。
音乐市场的潜在地震?

艺术家的阵线正在绘画领域,AI的设计师的设计师和稳定的扩散确实已经训练了他们宝贵的算法,这些算法是整个还活着的艺术家的创作。所有这些都是为了允许像您和我一样的Quidam用两个句子复制艺术家的风格,他有时一生都花了他的一生,不仅是他的艺术,而且是他的视觉认同。在这种运动可以使邦德进行严重的法律纠正的动作之间,以及CHAT-GPT的例子,在窃,作弊和其他学校的“ DIY”爆炸的例子中,强大的音频工具的到来迫使Google保持寒冷。
还阅读: 此免费AI只有一个目标:入侵版权图像(2023年1月)
因为在音乐领域的可能性和潜在虐待领域与图像一样巨大。除了对合理身份,音乐基金,情绪音乐等创造市场的创造市场的削弱(甚至破坏)。窃或“强大的灵感”的风险会引起一个或多个已知艺术家的愤怒。而且,如果Openai准备用Dall-E和Chat-GPT“破坏市场”以吸引投资者(例如Microsoft),那么像Google这样的Mastodon在其肩上承担了更多的责任和压力。在研究论文中清楚地理解和解释了责任“音乐LM:从文本中生成音乐”(英语文章):«我们强烈强调需要额外的未来工作来应对与音乐发电相关的风险 - 我们不打算在此阶段发布模型»»。显然:Google不想打开Pandora的盒子。只有较小风险的较小演员“ 公司的 ”负担得起...
还阅读:“没有革命性”:AI的法国先驱Yann Lecun并没有印象(2023年1月)
有人会在逻辑上做到!随着诸如Google之类的企业出版物的群众,许多音乐模型现在是激烈研究的主题。如果威胁对音乐生态系统很重要,那么承诺对世界其他地区也一样。是否有可能创建独特而没有版税音乐的可能性,独立视频游戏的快速而轻松的声音和音乐,等等。 AI显然最终会摇晃音乐创作市场。问题是法律框架是否能够监督其到达,还是将其充当新的潮汐。在已经知道很多的细分市场上。
来源 : 边缘