Zostaňte o krok pred šialenstvom textu a hudby experimentovaním s hudobným nástrojom AI od spoločnosti Meta.

Meta vydala kód pre MusicGen, ďalší hudobný generátor AI, ktorý dokáže premeniť textové popisy na hudobné melódie. Ukážku nájdete online a na vyskúšanie potrebujete iba prehliadač. Výsledky nie sú zlé, ale viac než to ukazuje, ako ďaleko pokročili hudobné modely AI.

Tu je to, čo potrebujete vedieť o MusicGen a ako generovať hudbu.

Čo je MusicGen?

V júni 2023 vydala spoločnosť Meta svoj model hudobnej generácie s názvom MusicGen. Nie je prvou spoločnosťou, ktorá rieši zložitý problém syntézy surovej hudby z jednoduchého textového popisu; zatiaľ môžete vytvárať hudbu pomocou jukeboxu OpenAI alebo vytvárať úryvky skladieb pomocou MusicLM.

Je to však prvá spoločnosť, ktorá vytvorila kód s otvoreným zdrojom, čo vám umožňuje spúšťať softvér lokálne na vašom počítači počítač, ak máte GPU s minimálne 16 GB pamäte – aj keď sme dokázali zabezpečiť, aby fungoval iba s 11 GB.

Nerobte si starosti, ak nemáte hardvér, pretože webovú aplikáciu MusicGen môžete vyskúšať zadarmo pomocou prehliadača. Z online ukážky môžete očakávať, že vygenerovanie zvukového úryvku s dĺžkou približne 12 sekúnd bude trvať niečo vyše minúty.

instagram viewer

Ako znie MusicGen?

Podľa Meta môže MusicGen produkovať vysokokvalitné hudobné vzorky, aj keď sme zistili, že zainteresovaní výskumníci to definovali vysoká kvalita až 32 kHz. To je niekde medzi požiadavkami syntézy reči (16 kHz) a štandardom pre digitálnu hudbu (44,1 kHz).

V skutočnosti zvuk nespĺňa minimálne štandardy kvality, na ktoré ste zvyknutí počuť v rádiu alebo na streamovacích platformách. V porovnaní s inými hudobnými generátormi AI a vzhľadom na to, kde sa technológia nachádza v čase písania, je však kvalita zvuku pomerne dobrá s nízkou úrovňou šumu v súbore.

Ako blízko je hudba v súlade s výzvami? Môžete to rýchlo pochopiť počúvaním príkladov, ktoré sme vygenerovali nižšie. Vo všeobecnosti sa mu darí držať sa žánrov populárnej hudby pri zachovaní ucelenejšej hudobnej štruktúry v porovnaní s jeho predchodcami.

Ako generovať hudbu pomocou MusicGen

MusicGen sa ľahko používa a nevyžaduje si registráciu. Rozhranie je tiež jednoduché, takže si ho môžete ľahko vyskúšať pre zábavu.

Tu je postup, ako generovať hudbu pomocou MusicGen:

  1. Otvor Webová aplikácia MusicGen.
  2. V textovom poli s názvom Popíšte svoju hudbu, zadajte výzvu. Môžete vyskúšať niečo také jednoduché, ako je „Írska ľudová melódia“, alebo to urobiť podrobnejšie zahrnutím nástroja, tempa, žánru alebo emócií.
  3. Stlačte tlačidlo Generovať tlačidlo na spustenie procesu. Po minúte alebo dvoch sa v module Generated Music napravo objaví audio prehrávač.
  4. Umiestnením kurzora myši na modul zobrazíte ovládacie prvky prehrávača a vypočujete si súbor, alebo stlačením ikony sťahovania v pravom hornom rohu uložíte súbor do počítača. Upozorňujeme, že je k dispozícii na stiahnutie iba ako súbor .mp4.
  5. Ak chcete vyskúšať úpravu výsledkov pomocou existujúcej melódie, môžete nahrať nahrávku do modulu vedľa textového poľa. Prípadne si môžete vybrať Mic na nahrávanie melódie pomocou mikrofónu.

Úprava melódie použije ako referenciu textový popis aj melódiu, ktorú poskytnete. Toto je užitočný nástroj na formovanie výsledkov, ktoré získate z MusicGen.

Aké sú obmedzenia používania MusicGen Audio?

Kód pre MusicGen je voľne šírený pod licenciou MIT s niekoľkými obmedzeniami. Pokiaľ ide o zvuk, ktorý generujete pomocou modelu, nie je jasné, či existujú nejaké právne pokyny. Namiesto toho možno budete chcieť venovať pozornosť Varovanie Meta o používaní MusicGen:

„Model by sa nemal používať na zámerné vytváranie alebo šírenie hudobných skladieb, ktoré vytvárajú pre ľudí nepriateľské alebo odcudzujúce prostredie. To zahŕňa vytváranie hudby, ktorú by ľudia predvídateľne považovali za znepokojujúcu, znepokojujúcu alebo urážlivú; alebo obsah, ktorý propaguje historické alebo súčasné stereotypy.“

Meta ďalej vysvetľuje, že MusicGen je určený pre výskumníkov, ktorí chcú skúmať hudobnú generáciu AI, a nie pre „následné použitia“, o ktorých predpokladáme, že znamenajú činnosti, ako je nahrávanie a distribúcia hudby umelej inteligencie pri streamovaní platformy.

The etické výhody a nevýhody odzrkadľujú generáciu umenia AI. Získanie súhlasu s používaním údajov na trénovanie modelov AI, plus problém s odmeňovaním/udeľovaním kreditov umelcom, keď je to vhodné, sú všetky dôvody, prečo to Meta hrá na istotu.

Stručne povedané, skúmanie modelu pre zábavu pravdepodobne nepoškodí, ale môže to byť pálčivejšia otázka, pokiaľ ide o použitie zvuku pre komerčnú hudbu. Veľa ľudí sa čuduje, čo budúcnosť populárnej hudby s AI vyzerá ako.

Pridaním ďalšieho modelu vytvárania hudby k tomu, čo je tam vonku, spoločnosť Meta vydala MusicGen, model umelej inteligencie s otvoreným zdrojom, ktorý dokáže generovať surovú hudbu z jednoduchého textového popisu. Ak ste zvedaví na vyskúšanie technológie, môžete si vyskúšať ukážku pomocou webového prehliadača.