Modely umelej inteligencie ako ChatGPT a Bard sú trénované pomocou údajov vytvorených ľuďmi. Čím viac údajov prijímajú, tým inteligentnejšie sa stávajú pri napodobňovaní ľudskej inteligencie a kreativity. Veľkí hráči v odvetví AI, ako OpenAI a Meta, nasadili veľké jazykové modely trénované zoškrabovaním textu a kníh dostupných online na extrahovanie údajov.
Vzhľadom na to, ako sú LLM vyškolení, bolo nevyhnutné, aby došlo ku konfliktu medzi autorským zákonom a umelou inteligenciou. Teraz sa kurčatá vracajú domov, aby sa usadili, pretože Sarah Silverman a ďalší umelci žalujú OpenAI a Meta za porušenie autorských práv.
In hromadná žaloba [PDF] podanom v Kalifornii, komička Sarah Silverman a ďalší spisovatelia (Christopher Golden a Richard Kadrey) sa snažia získať náhradu škody od OpenAI a Meta za porušenie autorských práv. Žaloba tvrdí, že OpenAI a Meta zoškrabali knihy chránené autorskými právami z pirátskych webových stránok, aby trénovali svoje modely AI. Ide o ekvivalent modelu AI, ktorý si stiahne svoje tréningové dátové súbory z Piratebay bez kompenzácie autorov.
Zhodou okolností a samostatná hromadná žaloba [PDF] proti OpenAI tvrdí, že spoločnosť použila neoprávnené súkromné informácie na školenie ChatGPT. Google tiež čelí podobnej žalobe za údajné používanie ukradnutých údajov na školenie Google Bard. To je dôvod, prečo by ste mali zvyknite si chrániť svoje osobné údaje, hoci zverejňovanie pracovných a súkromných osobných údajov nie je to isté.
Aké sú šance, že Sarah Silvermanová vyhrá súdny spor?
Silverman a ďalší umelci tvrdia, že ChatGPT dokáže na výzvu presne zhrnúť svoje knihy. Sťažnosť tvrdí, že by to nebolo možné, keby model AI nemal prístup k materiálu chránenému autorskými právami. Ak však bol ChatGPT vyškolený pomocou miliárd internetových textov, pravdepodobne sa stretol s článkami, komentármi a príspevkami na sociálnych médiách, ktoré diskutovali o knihách.
Meta ďalej prezradila, kde získala knihy, ktoré použila na trénovanie svojho modelu AI – zdroj bol vysledovaný na webovú stránku torrentu elektronických kníh. Podobne aj hromadná žaloba proti OpenAI spomína nelegálne webové stránky, kde je podozrenie, že OpenAI získala materiály chránené autorskými právami, ale OpenAI ešte nepotvrdila svoje zdroje.
Ak sa dokáže, že OpenAI a Meta používali nelegálne torrentové webové stránky na získanie materiálov chránených autorskými právami na trénovanie svojich modelov AI, Silverman môže mať šancu vyhrať súdny spor. Modely AI sú však neprebádané územie bez precedensu, na ktorý by sa súdy mohli spoliehať pri rozhodovaní o porušení autorských práv AI. V skutočnosti je to jeden z dôvodov EÚ navrhla zákon o umelej inteligencii.
Aká je budúcnosť modelov AI a autorského zákona?
Stále sme v začiatkoch AI, aby sme vedeli, ako sa prispôsobí zákonu o autorských právach. Je to ešte zložitejšie, keď sa to snažíme zistiť kto vlastní autorské práva na tvorbu AI. Ale pre ľudských tvorcov existujú predpisy, ktoré ich chránia pred tým, aby niekto iný pristupoval k ich materiálu chránenému autorskými právami bez kompenzácie, súhlasu alebo uznania. Ak pravidlá existujú pre ľudí, budú sa vzťahovať na modely AI?
Európsky parlament navrhol najbližší pohľad do budúcnosti o tom, ako budú modely AI v súlade s autorským zákonom. Ak bude zákon EÚ o AI schválený do zákona, modely AI, ako sú ChatGPT a Bard, budú musieť zverejniť všetky svoje zdroje údajov a údaje chránené autorskými právami používané na školenie. Pomôže to objasniť akýkoľvek zmätok, ak modely AI získali prístup ku knihám, filmom, hudbe a fotografiám chráneným autorskými právami na školenie prostredníctvom nelegálnych pirátskych webových stránok.
Rozsudok o hromadnej žalobe AI vytvorí právny precedens
Veľké jazykové modely dokážu zoškrabať všetky kúty internetu a nájsť dáta používané pri školení. Boli by však zodpovední za porušenie autorských práv, ak by sa dostali na nelegálne webové stránky torrentu, aby získali údaje? A ak áno, viete to dokázať?
Bez ohľadu na výsledok, skupinové žaloby proti technologickým spoločnostiam, ktoré vlastnia najpopulárnejšie modely AI, vytvoria precedens, ktorý bude relevantný v budúcnosti.