V dubnu 2023, hlavní digitální ředitelka Warner Music Group a výkonná viceprezidentka obchodního rozvoje Oana Ruxandra pro The Hash CoinDesk řekla, že očekává, že hudební nástroje poháněné umělou inteligencí (AI) „otevřejí svět tak, jak jsme to dosud nedělali,“ inspirující. „nové formy kreativity a subžánry“ napříč hudebním a zábavním průmyslem.
Zatímco vyhlídky Ruxandry jsou optimistické, uznala také obavy mnoha hudebníků: „Musíme být velmi ostražití,“ poznamenala s tím, že je důležité chránit kreativitu a práva umělců. Jen pár dní před Ruxandriným vystoupením v The Hash získala AI vytvořená hluboce falešná hudební skladba s názvem Heart On My Sleeve trakci tím, že napodobovala hlasy skladatelů Drake a The Weeknd – i když se na jejím vytvoření žádný umělec nepodílel. Místo toho tvůrci písně vycvičili robota s umělou inteligencí pomocí hudby umělců, což majitele labelu Universal Music Group rozzlobilo.
Ostatní hudebníci byli k nové technologii vstřícnější. O necelý týden později pozvala elektropopová hudebnice Grimes své fanoušky, aby pomocí jejího hlasu vytvořili své vlastní písně dabované umělou inteligencí, a rozšířila nabídku na rozdělení tantiém v poměru 50/50, čímž demonstrovala jedno kreativní řešení hlubokého falešného hlavolamu umělé inteligence.
Rozdělím 50 % licenčních poplatků za jakoukoli úspěšnou skladbu vygenerovanou umělou inteligencí, která používá můj hlas. Stejná dohoda jako s jakýmkoli umělcem, se kterým spolupracuji. Klidně použijte můj hlas bez trestu. Nemám žádné označení a žádné právní závazky.
— 𝔊𝔯𝔦𝔪𝔢𝔰 (@Grimezsz) 24. dubna 2023
S ohledem na výzvy duševního vlastnictví stále není pochyb o tom, že hudební nástroje umělé inteligence dokážou umělci umístit nové formy vyjádření na dosah ruky. Někdy může být umělá inteligence dokonce použita ke zlepšení hudební produkce tím, že zaplní technické nebo intelektuální mezery ve schopnostech umělce a pomůže jim přivést k životu ambiciózní koncepty během několika kliknutí. Tyto nástroje mohou také provádět úkoly zvukového inženýrství efektivněji, snižovat bariéry a čas potřebný k vydání hudby.
Když se podíváme na Web3, společnosti a umělci posouvají AI ještě dále tím, že spojují hudbu s pohlcujícími, interaktivními a uživateli generovanými zážitky v metavesmíru i mimo něj.
Hudební nástroje AI ve Web3
Řada krypto-nativních hudebníků a platforem již našla kreativní způsoby, jak integrovat nástroje umělé inteligence do své praxe.
Vezměme si například VNCCII, první metaverzní alter-ego producentky Samanthy Tauber se sídlem v Sydney. S využitím špičkového nástroje pro tvorbu 3D v reálném čase, Unreal Engine, si Tauber oblékne svůj avatar, aby kromě vystupování na virtuálních koncertech a show streamovala živé rozhovory z metaverze. Jako každá změna scény nebo kostýmu, digitální složka umělecké identity VNCCII rozšiřuje hranice jejího umění.
Web3 hudební společnost Pixelnyx kombinuje zážitky z rozšířené reality (AR) s metaverzním hraním a zaměřuje se na pomoc umělcům vytvářet nezapomenutelné zážitky pro fanoušky. Společnost PIXELYNX, kterou spoluzaložil producent elektronické hudby Deadmau5, který je známý tím, že posílá fanoušky na questy prostřednictvím The Sandbox a pořádá show v Decentralandu, si klade za cíl rozvinout naše tradiční představy o fanouškovství pomocí AI, Web3 a obsahu vytvářeného uživateli ( UGC).
V dubnu Pixelnyx vydal Korus, nástroj, který uživatelům umožňuje vytvářet hudební společníky s umělou inteligencí pomocí oficiálně licencovaného obsahu umělců.
Seznamte se s KORUS – hudebními společníky AI a budoucností hudby od naší dceřiné společnosti @pixelynx_io 🎶🤖 Společníci KORUS AI způsobí revoluci ve vytváření#musictím, že se budou vyvíjet a přizpůsobovat na základě vašich rozhodnutí, uvolní kreativitu a umožní tvůrcům vydělávat na hudbě zábavou a snadné rozhraní.
Další informace o KORUS:
— Animoca Brands (@animocabrands) 28. dubna 2023
Při použití v tomto duchu mohou hudební nástroje umělé inteligence pomoci, rozšířit nebo zlepšit tvůrčí styl umělce. I když nástroje ještě nejsou dost dobré, aby nahradily umělce, jsou působivé a neustále se „učí“ neustálou lidskou interakcí. Nahrazení hudebníků umělou inteligencí nebylo nikdy populární, jak dokazuje odmítnutí, které Spotify obdrželo po testování své vlastní verze umělého hudebního kurátoru. Navzdory kontroverzi kolem umělé inteligence mohou dnešní hudební umělci těžit z používání hudební produkce podporované umělou inteligencí způsobem, který respektuje řemeslo.
Nápad a spolupráce
WarpSound, adaptivní hudební platforma AI, našla několik způsobů, jak integrovat sběratelské předměty a digitální avatary založené na blockchainu do svých obchodních nabídek. Společnost, která produkuje hudební obsah, nezaměnitelné tokeny (NFT) a sociální zážitky, brzy uvolní softwarové API, které skládá originální hudební notu po notě v řadě stylů.
Zakladatel a generální ředitel Chris McGarry, podnikatel a mediální manažer, který dříve působil jako hudební vedoucí v jednotce virtuální reality Oculus na Facebooku, říká, že nástroje WarpSound pomáhají umělcům najít novou inspiraci a zdrojový materiál, který oživí jejich tvůrčí procesy. Společnost je příjemcem fondu The Sandbox’s Game Maker Fund, který podporuje herní designéry v metaverse The Sandbox a plánuje vybudovat v rámci platformy domácí místo, kde by umělci mohli experimentovat s generativní hudbou.
Ve spolupráci s globálním poskytovatelem plateb Mastercard také spustil AI Music Studio Artist Accelerator, kde McGarry říká, že pozoroval nové výhody tvůrčího procesu.
"Minulý týden jsem byl na sérii virtuálních studiových sezení s umělci, kteří se programu účastnili," řekl McGarry. „Pracovali jsme s naším generativním hudebním rozhraním umělé inteligence, abychom představili sadu hudebních nápadů, pak jsme je nechali umělce tvarovat a opakovat, dokud nedospěli k něčemu, co s nimi rezonovalo podstatou, s čím byli motivováni pracovat.“
WarpSound také spolupracuje s filmovým festivalem Tribeca a YouTube s cílem vytvořit interaktivní a hravé hudební zážitky mezi umělci a publikem.
Skládání a aranžmá
Pokud je váš hudební projekt méně o živém vystoupení a více o hotovém produktu – možná skládáte originální hudbu pro podcast, metaverse událost, kanál YouTube, videohru Web3 nebo vzdělávací obsah – můžete použít AI k urychlení procesu složení a uspořádání. Samozřejmě, že nejtalentovanější světoví virtuosové pravděpodobně dokážou dělat hudební stupnice ve spánku, ale s tolika prvky ve zvukové a video produkci se stává běžnou praxí používat AI k vkládání rychlých stupnic, arpeggií, běhů a harmonií do původní hudby.
Nástroje jako Riffusion umožňují uživatelům poskytovat textové výzvy, které jsou transformovány do hudby. Soundful je další platforma AI, která lidem umožňuje vytvářet a stahovat skladby bez licenčních poplatků.
Chcete-li jít ještě o krok dále a přidat text, oblíbený kutilský nástroj ChatGPT dokáže napsat dvouveršovou skladbu s pre-refrénem, chorusem, bridžem a outrem za méně než 30 sekund s minimálním pobízením. Texty mohou být samozřejmě trochu zjednodušené nebo kýčovité – ale nejsou některé z nejlepších písní?
Ve většině případů jsou skladby generované umělou inteligencí reprodukovatelné bez nutnosti platit licenční poplatky, protože byly vytvořeny stroji, a proto nejsou chráněny podle zákona o duševním vlastnictví USA. Většina platforem si však účtuje poplatek za předplatné.
Tyto zvuky pak mohou být raženy jako NFT a prodávány na tržištích, jako je OpenSea. Platformy jako Royal.io také umožňují umělcům připojit se k webu a nabízet své písně jako rozdělené NFT, které fanouškům nabízejí licenční poplatky.
Přečtěte si více: Co jsou hudební NFT?
Limity AI hudební produkce
Možná jste již slyšeli, že hudební nástroje umělé inteligence ještě nejsou tak sofistikované, zvláště ve srovnání s nejnovějšími generátory AI textu na obrázek (které již byly použity k vytvoření celých sbírek komiksů) a chatbotem Open AI, Chat GPT. (který údajně složil advokátní zkoušku).
Produkce zvuku skutečně vyžaduje větší výpočetní výkon než statické textové a obrazové výstupy, a proto podle odborníků v oboru zaostává. Alexander Flores, vedoucí technologie a strategie v hudební výzkumné síti Water & Music, říká, že technologické inovace obecně putují od formátů, které jsou nejméně náročné na data, k těm nejbohatším. V případě umělé inteligence dává smysl, proč jsou chatboti možná rychleji vyvíjení než vykreslování zvuku a videa pomocí umělé inteligence.
V jednom online diskuzním vláknu uživatel Redditu poukázal na tato omezení a zdůraznil, že zatímco autor může korigovat a upravovat výstupy AI chatbota během několika sekund, poslech skladby trvá několik minut a někdy dokonce hodiny, než ji upraví. Stroje se také pomaleji učí z datových sad AI, protože zvukové soubory, které je napájejí, mají zřídkakdy komplexní textové popisy, které by umělou inteligenci naučily atributy souboru (žánr, tempo, tónina, instrumentace atd.). Mezitím se umělá inteligence založená na textu a obrázcích dokáže rychle prokousat tisíci slov a vizuálních prvků.
„Hodně záleží na tom, jak dlouho trvá konzumace obsahu,“ řekl Flores. "S písničkou jsi na tři minuty zamčený." Nemůžete to urychlit, protože pak neprožíváte skutečnou píseň tak, jak byla napsána.“
Obrazy jsou navíc statické, zatímco písně jsou dynamičtější: „Audio je prostě mnohem více dimenzionální,“ řekl Stefan Lattner, vedoucí výzkumník v Sony CSL, laboratoři kreativních technologií, v panelu na inauguračním summitu Wavelengths Summit společnosti Water & Music. "Zatímco obrázky mají pevný počet pixelů, u zvuku máte proměnný počet sekund, které chcete vygenerovat."
Water & Music nicméně nazývá kreativní umělou inteligenci nejpřevratnější technologií pro hudební byznys od dob Napsteru, aplikace pro sdílení souborů peer-to-peer, díky níž je distribuce hudby prakticky bezplatná, bez hranic a bez povolení – koncept známý krypto-nativním lidem. .