2023 年 4 月,華納音樂集團首席數位長兼業務開發執行副總裁 Oana Ruxandra 告訴 CoinDesk 的 The Hash,她預計人工智慧 (AI) 驅動的音樂工具將“以前所未有的方式打開世界”,鼓舞人心音樂和娛樂產業的「新形式的創造力和子流派」。
儘管魯克桑德拉的前景很樂觀,但她也承認許多音樂家的擔憂:「我們必須非常警惕,」她說,並指出保護藝術家的創造力和權利的重要性。就在Ruxandra 出現在The Hash 節目的前幾天,一首由人工智慧生成的深度僞造音樂曲目《Heart On My Sleeve》透過模仿歌曲作者Drake 和the Weeknd 的聲音而獲得了關注——儘管兩位藝術家都沒有參與其創作。相反,這首歌的創作者使用藝術家的音樂來訓練人工智慧機器人,這激怒了唱片公司所有者環球音樂集團。
其他音樂家對這項新技術的歡迎程度更高。不到一週後,電子流行音樂人 Grimes 邀請她的粉絲用她的聲音創作自己的 AI 配音歌曲,並提出 50/50 分成,這爲 AI 深度僞造難題提供了一個創造性的解決方案。
我將對任何使用我的聲音的成功的 AI 生成歌曲分享 50% 的版稅。與我合作的任何藝術家的交易相同。請隨意使用我的聲音而不會受到懲罰。我沒有標籤,也不受法律約束。
— 𝔊𝔯𝔦𝔪𝔢𝔰 (@Grimezsz) 2023 年 4 月 24 日
考慮到知識產權方面的挑戰,毫無疑問,人工智能音樂工具可以爲藝術家提供新的表達形式。有時,人工智能甚至可以用來填補藝術家在技術或智力方面的空白,幫助他們在點擊幾下鼠標後將雄心勃勃的概念變爲現實,從而提高音樂創作能力。這些工具還可以更有效地執行聲音工程任務,降低發佈音樂的門檻和時間。
當我們展望 Web3 時,公司和藝術家通過將音樂與元宇宙及其他領域的沉浸式、互動式和用戶生成的體驗相結合,將人工智能推向了更高的境界。
Web3 中的 AI 音樂工具
許多加密原生音樂家和平臺已經找到了將人工智能工具融入其實踐的創造性方法。
以 VNCCII 爲例,她是悉尼女製作人 Samantha Tauber 在元宇宙中的第一個化身。利用業界領先的實時 3D 創作工具 Unreal Engine,Tauber 化身爲元宇宙中的直播採訪,並在虛擬音樂會和表演中表演。就像任何佈景或服裝變化一樣,VNCCII 藝術身份的數字部分正在拓展她的藝術邊界。
Web3 音樂公司 Pixelnyx 將增強現實 (AR) 體驗與元宇宙遊戲相結合,專注於幫助藝術家爲粉絲打造難忘的體驗。PIXELYNX 由電子音樂製作人 Deadmau5 聯合創立,Deadmau5 因通過 The Sandbox 向粉絲髮送任務並在 Decentraland 舉辦節目而聞名,該公司旨在通過使用人工智能、Web3 和用戶生成內容 (UGC) 來改變我們傳統的粉絲觀念。
今年 4 月,Pixelnyx 發佈了 Korus,這是一款允許用戶使用官方授權的藝術家內容創建人工智能音樂伴侶的工具。
認識 KORUS——來自我們子公司@pixelynx_io 的音樂 AI 伴侶和音樂的未來 🎶🤖 KORUS AI 伴侶將根據您的選擇不斷髮展和適應,釋放創造力,並讓創作者通過有趣且簡單的界面從音樂中賺錢,從而徹底改#music的創作。
瞭解有關韓美關係的更多信息:
— Animoca Brands (@animocabrands) 2023 年 4 月 28 日
秉承這種精神使用人工智能音樂工具,可以輔助、增強或提升藝術家的創作風格。雖然這些工具還不足以取代藝術家,但它們令人印象深刻,並且通過持續的人機交互不斷“學習”。用人工智能取代音樂家從來都不是一個受歡迎的想法,Spotify 在測試自己的人工智能音樂策劃版本後受到的反對就是明證。然而,儘管圍繞人工智能存在爭議,但當今的音樂藝術家或許能夠從以尊重手藝的方式使用人工智能輔助音樂製作中受益。
構思與協作
WarpSound 是一個自適應 AI 音樂平臺,它已經找到了多種方式將基於區塊鏈的收藏品和數字化身融入其業務產品中。該公司製作音樂內容、非同質化代幣 (NFT) 和社交體驗,即將發佈一個軟件 API,可以逐個音符地創作各種風格的原創音樂。
創始人兼首席執行官克里斯·麥加里 (Chris McGarry) 是一位企業家和媒體高管,曾擔任 Facebook 虛擬現實部門 Oculus 的音樂主管。他表示,WarpSound 的工具可以幫助藝術家找到新的靈感和素材,激發他們的創作過程。該公司是 The Sandbox 遊戲製作基金的獲得者,該基金支持 The Sandbox 元宇宙中的遊戲設計師,並計劃在平臺內建立一個家庭場所,讓藝術家可以在那裏嘗試生成音樂。
它還與全球支付提供商萬事達卡合作推出了 AI 音樂工作室藝術家加速器,麥加里說他觀察到了創作過程的新好處。
“上週,我與參與該計劃的藝術家們進行了一系列虛擬工作室會議,”麥加里說。“我們使用我們的生成式人工智能音樂界面來呈現一系列音樂創意,然後讓藝術家們塑造這些創意並不斷迭代,直到他們找到某種能引起他們共鳴的精髓,並激勵他們繼續創作。”
WarpSound 還與翠貝卡電影節和 YouTube 合作,在藝術家和觀衆之間創造互動且有趣的音樂體驗。
作曲及編曲
如果您的音樂項目不注重現場表演,而更注重成品——也許您正在爲播客、元宇宙活動、YouTube 頻道、Web3 視頻遊戲或教育內容創作原創音樂——您可以使用 AI 來加快創作和編曲的過程。當然,世界上最有才華的演奏家很可能在睡夢中也能演奏出音階,但由於聲音和視頻製作包含如此多的元素,使用 AI 在原創音樂中插入快速音階、琶音、跑動和和聲已成爲標準做法。
Riffusion 等工具允許用戶提供文本提示,並將其轉換爲音樂。Soundful 是另一個允許人們生成和下載免版稅曲目的 AI 平臺。
如果你想更進一步添加歌詞,流行的萬能工具 ChatGPT 可以在不到 30 秒的時間內,在極少的提示下,創作出一首包含前奏、合唱、過渡和結尾的兩段歌曲。當然,歌詞可能有點簡單或俗氣——但這不是最好的歌曲嗎?
在大多數情況下,人工智能生成的歌曲是可以複製的,無需支付許可費,因爲它們是由機器製作的,因此不受美國知識產權法的保護。然而,大多數平臺都會收取訂閱費。
這些聲音隨後可以被鑄造爲 NFT,並在 OpenSea 等市場上出售。Royal.io 等平臺還允許藝術家加入該網站,並以部分 NFT 的形式提供他們的歌曲,爲粉絲提供版稅支付。
閱讀更多:什麼是音樂 NFT?
人工智能音樂製作的侷限性
您可能已經聽說過,音樂 AI 工具還沒有那麼複雜,尤其是與最新的 AI 文本到圖像生成器(已經用於製作整個漫畫書集)和 Open AI 的聊天機器人 Chat GPT(據報道通過了律師資格考試)相比時。
音頻製作確實需要比靜態文本和圖像輸出更多的計算能力,因此該領域的專家表示,音頻製作落後了。音樂研究網絡 Water & Music 的技術和戰略主管 Alexander Flores 表示,技術創新通常從數據密集程度最低的格式發展到數據密集程度最高的格式。就人工智能而言,聊天機器人的開發速度可能比人工智能音頻和視頻渲染更快,這是有道理的。
在一個在線討論主題中,一位 Reddit 用戶指出了這些限制,強調雖然作家可以在幾秒鐘內校對和編輯 AI 聊天機器人的輸出,但聽一首歌卻需要幾分鐘,有時甚至需要幾個小時才能編輯。機器從 AI 數據集中學習的速度也較慢,因爲輸入它們的音頻文件很少有全面的文本描述來教 AI 有關文件的屬性(流派、節奏、音調、樂器等)。與此同時,基於文本和圖像的 AI 可以快速搜索數千個單詞和視覺效果。
“花多長時間來消化內容非常重要,”弗洛雷斯說。“聽一首歌,你會被困在裏面三分鐘。你不能加快速度,因爲那樣你就無法體驗到歌曲原本的面貌了。”
此外,圖像是靜態的,而歌曲則更具動態性:“音頻的維度要高得多,”創意技術實驗室 Sony CSL 的執行研究員 Stefan Lattner 在 Water & Music 的首屆波長峯會的一個小組討論中說道。“圖像的像素數量是固定的,而音頻中想要生成的秒數是可變的。”
儘管如此,Water & Music 仍將創意人工智能稱爲自 Napster 以來音樂行業最具顛覆性的技術。Napster 是一款點對點文件共享應用程序,它使音樂分發幾乎免費,並且無邊界和無需許可——這一概念爲加密原生代所熟悉。