2023 年 4 月,华纳音乐集团首席数位长兼业务开发执行副总裁 Oana Ruxandra 告诉 CoinDesk 的 The Hash,她预计人工智慧 (AI) 驱动的音乐工具将“以前所未有的方式打开世界”,鼓舞人心音乐和娱乐产业的「新形式的创造力和子流派」。
尽管鲁克桑德拉的前景很乐观,但她也承认许多音乐家的担忧:「我们必须非常警惕,」她说,并指出保护艺术家的创造力和权利的重要性。就在Ruxandra 出现在The Hash 节目的前几天,一首由人工智慧生成的深度伪造音乐曲目《Heart On My Sleeve》透过模仿歌曲作者Drake 和the Weeknd 的声音而获得了关注——尽管两位艺术家都没有参与其创作。相反,这首歌的创作者使用艺术家的音乐来训练人工智慧机器人,这激怒了唱片公司所有者环球音乐集团。
其他音乐家对这项新技术的欢迎程度更高。不到一周后,电子流行音乐人 Grimes 邀请她的粉丝用她的声音创作自己的 AI 配音歌曲,并提出 50/50 分成,这为 AI 深度伪造难题提供了一个创造性的解决方案。
我将对任何使用我的声音的成功的 AI 生成歌曲分享 50% 的版税。与我合作的任何艺术家的交易相同。请随意使用我的声音而不会受到惩罚。我没有标签,也不受法律约束。
— 𝔊𝔯𝔦𝔪𝔢𝔰 (@Grimezsz) 2023 年 4 月 24 日
考虑到知识产权方面的挑战,毫无疑问,人工智能音乐工具可以为艺术家提供新的表达形式。有时,人工智能甚至可以用来填补艺术家在技术或智力方面的空白,帮助他们在点击几下鼠标后将雄心勃勃的概念变为现实,从而提高音乐创作能力。这些工具还可以更有效地执行声音工程任务,降低发布音乐的门槛和时间。
当我们展望 Web3 时,公司和艺术家通过将音乐与元宇宙及其他领域的沉浸式、互动式和用户生成的体验相结合,将人工智能推向了更高的境界。
Web3 中的 AI 音乐工具
许多加密原生音乐家和平台已经找到了将人工智能工具融入其实践的创造性方法。
以 VNCCII 为例,她是悉尼女制作人 Samantha Tauber 在元宇宙中的第一个化身。利用业界领先的实时 3D 创作工具 Unreal Engine,Tauber 化身为元宇宙中的直播采访,并在虚拟音乐会和表演中表演。就像任何布景或服装变化一样,VNCCII 艺术身份的数字部分正在拓展她的艺术边界。
Web3 音乐公司 Pixelnyx 将增强现实 (AR) 体验与元宇宙游戏相结合,专注于帮助艺术家为粉丝打造难忘的体验。PIXELYNX 由电子音乐制作人 Deadmau5 联合创立,Deadmau5 因通过 The Sandbox 向粉丝发送任务并在 Decentraland 举办节目而闻名,该公司旨在通过使用人工智能、Web3 和用户生成内容 (UGC) 来改变我们传统的粉丝观念。
今年 4 月,Pixelnyx 发布了 Korus,这是一款允许用户使用官方授权的艺术家内容创建人工智能音乐伴侣的工具。
认识 KORUS——来自我们子公司@pixelynx_io 的音乐 AI 伴侣和音乐的未来 🎶🤖 KORUS AI 伴侣将根据您的选择不断发展和适应,释放创造力,并让创作者通过有趣且简单的界面从音乐中赚钱,从而彻底改#music的创作。
了解有关韩美关系的更多信息:
— Animoca Brands (@animocabrands) 2023 年 4 月 28 日
秉承这种精神使用人工智能音乐工具,可以辅助、增强或提升艺术家的创作风格。虽然这些工具还不足以取代艺术家,但它们令人印象深刻,并且通过持续的人机交互不断“学习”。用人工智能取代音乐家从来都不是一个受欢迎的想法,Spotify 在测试自己的人工智能音乐策划版本后受到的反对就是明证。然而,尽管围绕人工智能存在争议,但当今的音乐艺术家或许能够从以尊重手艺的方式使用人工智能辅助音乐制作中受益。
构思与协作
WarpSound 是一个自适应 AI 音乐平台,它已经找到了多种方式将基于区块链的收藏品和数字化身融入其业务产品中。该公司制作音乐内容、非同质化代币 (NFT) 和社交体验,即将发布一个软件 API,可以逐个音符地创作各种风格的原创音乐。
创始人兼首席执行官克里斯·麦加里 (Chris McGarry) 是一位企业家和媒体高管,曾担任 Facebook 虚拟现实部门 Oculus 的音乐主管。他表示,WarpSound 的工具可以帮助艺术家找到新的灵感和素材,激发他们的创作过程。该公司是 The Sandbox 游戏制作基金的获得者,该基金支持 The Sandbox 元宇宙中的游戏设计师,并计划在平台内建立一个家庭场所,让艺术家可以在那里尝试生成音乐。
它还与全球支付提供商万事达卡合作推出了 AI 音乐工作室艺术家加速器,麦加里说他观察到了创作过程的新好处。
“上周,我与参与该计划的艺术家们进行了一系列虚拟工作室会议,”麦加里说。“我们使用我们的生成式人工智能音乐界面来呈现一系列音乐创意,然后让艺术家们塑造这些创意并不断迭代,直到他们找到某种能引起他们共鸣的精髓,并激励他们继续创作。”
WarpSound 还与翠贝卡电影节和 YouTube 合作,在艺术家和观众之间创造互动且有趣的音乐体验。
作曲及编曲
如果您的音乐项目不注重现场表演,而更注重成品——也许您正在为播客、元宇宙活动、YouTube 频道、Web3 视频游戏或教育内容创作原创音乐——您可以使用 AI 来加快创作和编曲的过程。当然,世界上最有才华的演奏家很可能在睡梦中也能演奏出音阶,但由于声音和视频制作包含如此多的元素,使用 AI 在原创音乐中插入快速音阶、琶音、跑动和和声已成为标准做法。
Riffusion 等工具允许用户提供文本提示,并将其转换为音乐。Soundful 是另一个允许人们生成和下载免版税曲目的 AI 平台。
如果你想更进一步添加歌词,流行的万能工具 ChatGPT 可以在不到 30 秒的时间内,在极少的提示下,创作出一首包含前奏、合唱、过渡和结尾的两段歌曲。当然,歌词可能有点简单或俗气——但这不是最好的歌曲吗?
在大多数情况下,人工智能生成的歌曲是可以复制的,无需支付许可费,因为它们是由机器制作的,因此不受美国知识产权法的保护。然而,大多数平台都会收取订阅费。
这些声音随后可以被铸造为 NFT,并在 OpenSea 等市场上出售。Royal.io 等平台还允许艺术家加入该网站,并以部分 NFT 的形式提供他们的歌曲,为粉丝提供版税支付。
阅读更多:什么是音乐 NFT?
人工智能音乐制作的局限性
您可能已经听说过,音乐 AI 工具还没有那么复杂,尤其是与最新的 AI 文本到图像生成器(已经用于制作整个漫画书集)和 Open AI 的聊天机器人 Chat GPT(据报道通过了律师资格考试)相比时。
音频制作确实需要比静态文本和图像输出更多的计算能力,因此该领域的专家表示,音频制作落后了。音乐研究网络 Water & Music 的技术和战略主管 Alexander Flores 表示,技术创新通常从数据密集程度最低的格式发展到数据密集程度最高的格式。就人工智能而言,聊天机器人的开发速度可能比人工智能音频和视频渲染更快,这是有道理的。
在一个在线讨论主题中,一位 Reddit 用户指出了这些限制,强调虽然作家可以在几秒钟内校对和编辑 AI 聊天机器人的输出,但听一首歌却需要几分钟,有时甚至需要几个小时才能编辑。机器从 AI 数据集中学习的速度也较慢,因为输入它们的音频文件很少有全面的文本描述来教 AI 有关文件的属性(流派、节奏、音调、乐器等)。与此同时,基于文本和图像的 AI 可以快速搜索数千个单词和视觉效果。
“花多长时间来消化内容非常重要,”弗洛雷斯说。“听一首歌,你会被困在里面三分钟。你不能加快速度,因为那样你就无法体验到歌曲原本的面貌了。”
此外,图像是静态的,而歌曲则更具动态性:“音频的维度要高得多,”创意技术实验室 Sony CSL 的执行研究员 Stefan Lattner 在 Water & Music 的首届波长峰会的一个小组讨论中说道。“图像的像素数量是固定的,而音频中想要生成的秒数是可变的。”
尽管如此,Water & Music 仍将创意人工智能称为自 Napster 以来音乐行业最具颠覆性的技术。Napster 是一款点对点文件共享应用程序,它使音乐分发几乎免费,并且无边界和无需许可——这一概念为加密原生代所熟悉。