Home » AGH 2023/24 » Prawa autorskie a generowanie tekstów, muzyki i filmów. Obecne dyskusje.

Prawa autorskie a generowanie tekstów, muzyki i filmów. Obecne dyskusje.

By Filip Ręka and Daniel Kuc in AGH 2023/24 on 23 kwietnia, 2024

Spread the love

Od roku 2020 szybki rozwój generatywnych modeli sztucznej inteligencji opartych na głębokim uczeniu rodzi pytania o to, czy trening oraz treści wygenerowane przez sztuczną inteligencję łamią prawa autorskie. Obejmuje to modele text to image, takie jak Stable Diffusion oraz duże modele językowe, takie jak ChatGPT. Od 2023 r. w Stanach Zjednoczonych toczy się kilka spraw sądowych kwestionujących wykorzystanie danych chronionych prawem autorskim do szkolenia modeli sztucznej inteligencji, a pozwani twierdzą, że wchodzi to w zakres dozwolonego użytku (fair use).

Popularne modele głębokiego uczenia są szkolone na masowych ilościach mediów pobranych z Internetu, często wykorzystując materiały chronione prawem autorskim. Podczas gromadzenia danych szkoleniowych pozyskiwanie utworów chronionych może naruszać wyłączne prawo posiadacza praw autorskich do kontrolowania reprodukcji, chyba że jest to objęte wyjątkami w odpowiednich przepisach. Ponadto korzystanie z wyników modelu może naruszać prawa autorskie, a twórca modelu może zostać oskarżony i pociągnięty do odpowiedzialności za ich naruszenie.

Ponieważ większość jurysdykcji prawnych przyznaje prawa autorskie tylko do oryginalnych dzieł autorstwa ludzkich autorów, definicja „oryginalności” ma kluczowe znaczenie dla statusu praw autorskich dzieł generowanych przez sztuczną inteligencję.

Większość dyskusji na temat praw autorskich dotyczy Stanów Zjednoczonych, ponieważ większość firm tworzących modele generacyjne, ma siedzibę właśnie w tym kraju. W USA „Copyright Act” chroni „oryginalne dzieła autorskie”. U.S. Copyright Office interpretuje ten fragment jako dzieło stworzone wyłącznie przez człowieka, odrzucając przyznania praw autorskich do dzieł wygenerowanych bez jego interwencji. Przykładowymi sprawami, które były wcześniej rozstrzygane w sprawach autorstwa prac dotyczą takich przypadków jak serię zdjęć zrobione przez małpę, gdzie PETA wystąpiła z wnioskiem który przypisałby prawa autorskie do zdjęć zwierzęciu lub Księga Urantii rzekomo napisana przez niebiańskie istoty. W tym przypadku kwestia praw autorskich nie jest kwestią metafizyczną wymagającą od sądu ustalenia, czy Księga ma niebiańskie pochodzenie. Jednakże dla celów praw autorskich dzieło podlega prawu autorskiemu, jeśli prawa autorskie zgłoszą pierwsi ludzie, którzy połączyli, wybrali, skoordynowali i uporządkowali nauki Urantii „w taki sposób, że powstałe dzieło jako całość stanowi oryginalne dzieło autorskie.”

Niektóry prawnicy sugerują, że niektóre „prace” stworzone przez AI mogą podlegać prawu autorskiemu, jeśli można wykazać, że „autor” wykazał się wystarczającą oryginalnością w doborze danych lub edytując wynikowe dzieło.

Zwolennicy takiego podejścia podejścia sugerują, że modele sztucznej inteligencji mogą być jedynie postrzegane jako narzędzie (podobnie jak w przypadku pióra lub aparatu fotograficznego) używanego przez twórcę do wyrażenia swojej artystycznej wizji. Dodają również, że skoro standard oryginalności może zostać spełniony jako przez artystę, który naciska spust migawki, to również artysta korzystający z generacyjnego AI, powinien dostać podobny szacunek, szczególnie jeśli „prompt” jak i również dane wynikowe przechodzą przez wystarczająco wiele rewizji. Inni twierdzą, że Urząd Praw Autorskich nie przyjmuje neutralnego technologicznie stanowiska do korzystania ze sztucznej inteligencji lub innych narzędzi algorytmicznych. W przypadku wszystkich form jakiejkolwiek ekspresji twórczej tematem jest to, czy istnieje de minimis. Termin ten tłumaczony na język polski znaczy „o minimalnym znaczeniu” oraz pochodzi z dziedziny ekonomi i odnosi się do sytuacji, które są zbyt niewielkie, aby w szczególny sposób je regulować.

Tą różnicę w podejściu można zaobserwować w niedawnej decyzji dotyczącej pracy, której autorem jest Jason Matthew Allen o tytule „Théâtre D’opéra Spatial” stworzonego przy pomocy Midjourney oraz narzędzia poprawiającego rozdzielczość Gigapixel AI.

Théâtre D’opéra Spatial – Jason M. Allen via Midjurney

Praca ta wygrała konkurs malarski Colorado State Fair w kategorii „digital art/digitally manipulated photography” i została złożona pod nazwiskiem „Jason M. Allen via Midjourney„. Mimo to sędziowie nie byli świadomi że praca została wykonana przy pomocy AI, jednak po werdykcie zapewnili, że nawet jeśli by o tym wiedzieli i tak przyznaliby pierwsze miejsce.

Urząd Praw Autorskich stwierdził że:

„The Board finds that the Work contains more than a de minimis amount of content generated by artificial intelligence („AI”), and this content must therefore be disclaimed in an application for registration. Because Mr. Allen is unwilling to disclaim the AI-generated material, the Work cannot be registered as submitted.„

Innymi słowy praca została odrzucona na podstawie tego że „nie została wykonana przez człowieka”. Pomimo to Allen uparcie dążył do zarejestrowania swojej pracy. Wysłał pisemne wyjaśnienie do Urzędu Praw Autorskich, w którym wyszczególnił, jak wiele zrobił, by zmanipulować to, co wyczarował Midjourney, a także jak bardzo majstrował przy surowym obrazie, używając Adobe Photoshop do naprawienia wad i Gigapixel AI do zwiększenia rozmiaru i rozdzielczości. Określił, że stworzenie obrazu wymagało co najmniej 624 podpowiedzi tekstowych i korekt danych wejściowych.

Zakładając jednak, że istnieje podstawa, aby dowolna praca stworzona przy pomocy AI została uznana za godną nadania jej praw autorskich pozostaje pytanie kto byłby ich właścicielem. Intuicyjnie można znowu wykorzystać analogię do aparatu fotograficznego, gdzie AI jest aparatem, firma tworząca AI jest producentem, a użytkownik pozostaje użytkownikiem. Przez analogię można stwierdzić że tak jak właścicielem zdjęcia jest jego autor, tak właścicielem pracy stworzonej przy pomocy sztucznej inteligencji jest „prompter”. Z drugiej strony kreatywne wybory związane z kodowaniem, doborem danych oraz szkoleniem algorytmów może dać twórcy sztucznej inteligencji silniejsze roszczenia do jakiejś formy autorstwa niż producent aparatu.

Proces treningu modeli a naruszanie prawa autorskiego

Trening modeli sztucznej inteligencji odbywa się przez wystawianie algorytmu na olbrzymia ilość danych pobranych z sieci. Urząd Patentów i Znaków Towarowych Stanów Zjednoczonych opisał ten proces jako taki, który „będzie niemal z definicji obejmować reprodukcję całych dzieł lub znaczne ich części”. OpenAI przyznało się, że ich modele były trenowane na części danych objętymi prawami autorskimi.

Firmy tworzące modele zwykle bronią proces treningu jako stanowiącego fair use czyli zaliczającego się do przypadków gdzie:

cel i charakter użycia dzieła, w szczególności kwestia, czy zostało ono użyte w celu komercyjnym, czy niekomercyjnym i edukacyjnym;
rodzaj i natura użytego dzieła;
proporcja objętości i znaczenia fragmentu użytego dzieła w stosunku do całej jego objętości, a także objętości i znaczenia dzieła pochodnego, w którym ten fragment został użyty;
rezultaty wpływu użycia tego dzieła na jego sprzedaż oraz wartość na rynku.

Firmy również zaznaczają, że kopie dzieł objętych prawami autorskimi nie są udostępniane użytkownikom, a jedynie są wykorzystywane podczas treningu modelu. Precedensem do tego rodzaju stwierdzeń jest The Authors Guild vs Google, gdzie sąd stwierdził, że nie zostało naruszone prawo, kiedy Google kopiowało całe książki w celu stworzenia przeszukiwalnej bazy danych, która wyświetlała fragmenty tych książek, ponieważ stanowiło to dozwolony użytek.

Innym problemem jest możliwości stworzenia przez algorytmy prac, które są zbyt podobne do tych, na których zostały one nauczone. Problem ten może wystąpić podczas tak zwanego overfittingu, czyli sytuacji w której model zbyt dobrze dopasował się danych (innymi słowy je zapamiętał) i nie nauczył się wystarczającej generalizacji. OpenAI twierdzi, że takie przypadki występują tylko w źle wytrenowanych modelach. w 2023 powstał artykuł naukowy na ten temat, gdzie autorzy przetestowali model Stable Diffusion i udało im się uzyskać bardzo podobne grafiki tylko dla 0.03% danych na których model został wytrenowany. Inne badanie podaje tą wartość jako 2%.

Porównanie obrazków, które udało się „odzyskać” z modelu Stable Diffusion

Istnieją jeszcze inne dwa problemy z wygenerowanym medium. Po pierwsze algorytm może zostać poproszony o wygenerowania np. fikcyjnej postaci, która jest już objęta prawem autorskim, co narusza prawo. Drugim przykładem jest poproszenia algorytmu o wygenerowanie pracy „w podobnym stylu” np. pewnego artysty lub autora. Tego rodzaju zabieg nie jest jeszcze naruszeniem praw autorskich, ponieważ prawo chroni kopiowanie konkretach prac a nie stylu artysty. Pomimo tego istnieje obawa, że przykładowo modele generacyjne naśladujące czyjąś mowę, naruszają prawo dobra osobistego (right of publicity). Niemniej jednak, niektórzy artyści obawiają się, że programy AI są wyjątkowo zdolne do masowej produkcji dzieł, które kopiują ich styl, potencjalnie obniżając wartość ich pracy. W jednym z pozwów przeciwko Stable Diffusion artyści twierdzą, że niewielu artystów potrafi z powodzeniem naśladować styl innego artysty podczas gdy modele AI są w stanie zrobić to z łatwością.

Temat prawa autorskiego w kontekście generatywnego AI jest bardzo złożony. Jest prowadzone obecnie kilka spraw na temat tego, co można uznać za wystarczający wkład w pracę, aby zasługiwała ona na objęcie przez prawo. Osobiście nie spodziewałbym się abyśmy szybko otrzymali pozytywny wyrok w tej kwestii, głownie dlatego, że żaden sąd (mówiąc o Stanach Zjednoczonych) nie chce ustanowić precedensu, na podstawie którego inne sądy mogłyby wydać taki sam wyrok.

Źródła:

https://crsreports.congress.gov/product/pdf/LSB/LSB10922 – Artykuł Congressional Research Service na temat generatywnego AI i prawa autorskiego

https://arxiv.org/pdf/2212.03860.pdf – Artykuł na temat replikacji danych przez Midjurney

https://www.firstpost.com/explainers/explained-the-controversy-surrounding-the-ai-generated-artwork-that-won-us-competition-11188431.html – Kontrowersyjna praca na konkursie

Prawa autorskie a generowanie tekstów, muzyki i filmów. Obecne dyskusje.

Proces treningu modeli a naruszanie prawa autorskiego

Źródła:

Leave a comment Anuluj pisanie odpowiedzi