W świecie cyfrowym, gdzie Sztuczna Inteligencja (SI) staje się coraz bardziej powszechna, tworzenie obrazów za pomocą algorytmów budzi wiele pytań dotyczących praw autorskich. W tym wpisie przyjrzymy się temu, czym jest generowanie obrazów oparte o SI i jakie kontrowersje wywołuje.
Na czym polega tworzenie obrazów oparte o SI?
Korzystanie z narzędzi umożliwiających generowanie obrazów przy pomocy SI jest niezwykle proste. Aby otrzymać wymarzony obraz wystarczy jedynie opisać kluczowe elementy które mają się na nim znajdować. Zestaw słów w oparciu o które SI tworzy obrazy nazywane są promptami. Oczywiście wymuszenie od SI tego aby obraz dokładnie pokrywał się z tym w naszej głowie może wymagać trochę gimnastyki, czego efektem było powstanie nowego zawodu – prompt engineer, który zajmuje się przygotowaniem promptów dających efekt jak najbardziej zbieżnego z oczekiwaniami. Jeśli ktoś nie ma jednak aż tak wygórowanych wymagań, to wystarczy zaledwie chwila, aby uzyskać praktycznie dowolny obraz.
Ale jak to właściwie działa?
Dokładny schemat działania modeli umożliwiających tworzenie obrazów jest dość skomplikowany i może różnić się w zależności od narzędzia. Niemniej jednak odgórna zasada działania pozostaje taka sama. Model składa się z milionów liczbowych parametrów. Aby liczby te miały sens, konieczne jest tzw. wytrenowanie modelu. Proces ten polega na zebraniu dużej liczby obrazów i “pokazywaniu ich SI”, aż to w końcu znajdzie w nich pewne zależności, które zostaną zapisane w parametrach.
Jedną z rodzin modeli SI są Generative adversarial network (GAN). Trening GANa polega na uczeniu w zasadzie dwóch modeli – jeden ma za zadanie generować obrazy wyglądają na prawdziwe, a drugi oceniać czy obraz jest rzeczywisty, czy też wygenerowany pierwszym modelem. Modele te prowadzą swoisty wyścig zbrojeń – pierwszy stara się generować jak najlepsze obrazy aby oszukać drugi, a drugi poznaje coraz to nowe techniki rozpoznawania sztucznych obrazów. Na końcu takiego procesu zachowuje się tylko 1. model – na tym etapie umie on już generować całkiem niezłe obrazy.
Prawdziwy przełom przyniosły jednak modele dyfuzyjne. Ich trening opiera się na dwóch czynnościach. Pierwszą z nich jest stopniowe degradowanie obrazów, tak że stają się one jedynie niewiele znaczącym szumem. Daje to możliwość wytrenowania komponentu zwanego “noise predictor”, który umie oszacować ile warstw szumu zostało dodanych do obrazu. Proces ten następnie można odwrócić. W tym celu generuje się “losowy” obraz i pyta noise predictor, ile szumu zostało dodane. Stopniowe odejmowanie szumu pozwala na uzyskanie nowego obrazu.
Kontrowersje związane z trenowaniem modeli sztucznej inteligencji
Do skutecznego wytrenowania modeli generatywnych potrzeba wielu przykładowych obrazów. Zazwyczaj używa się w tym celu ogólnodostępnych grafik z internetu. Takie postępowanie budzi jednak pewne kontrowersje. Nie każdy artysta który umieścił swoje dzieło w internecie chce przyczyniać się do rozwoju sztucznej inteligencji. Tym bardziej, że rozwój popularności generatywnych SI oznacza tym samym spadek zapotrzebowania na usługi klasycznych malarzy i grafików. Z jednej strony, firmy stojące za SI wykorzystują do treningu dzieła bez pytania autorów o zgodę. Z drugiej jednak strony, obrazy te są dostępne w internecie, a sam trening polega jedynie na ustawieniu odpowiednich parametrów modelu, wobec czego twórcy modeli SI powołują się na dozwolony użytek. Czym więc taki proces różni się od analizy dzieł i próby naśladowania innych twórców przez początkującego malarza?
Sytuacja ta nie jest również oczywista z prawnego punktu widzenia. W styczniu 2023 trzech artystów Sarah Andersen, Kelly McKernan i Karla Ortiz złożyli pozew przeciwko trzem firmom powiązanym z rozwojem SI (Midjourney, Stability DeviantArt). Sąd Dystryktowy USA zdecydował się odrzucić roszczenia twórców, pozostawiając im możliwość odwołania od decyzji, z którą artyści zapowiedzieli się zakwestionować. Na decyzję sądu wpływ miały jednak niedociągnięcia w sformułowaniu treści pozwu, a nie konkretne zapisy dotyczące trenowania modeli. Obecnie, brakuje jeszcze dobrze zdefiniowanego prawa powiązanego ze sztuczną inteligencją, chociaż pojawiają się już próby definiowania go, czego przykładem jest Unijny Akt ws. sztucznej inteligencji. Akt ten kładzie nacisk na przejrzystość treningu generatywnego SI, jednak nie zabrania wykorzystywania chronionych prawem autorskim danych wykorzystywanych do szkolenia systemów sztucznej inteligencji.
Warto również wspomnieć, o powstawaniu specjalnych narzędzi, które mają za zadanie utrudnić SI nauczenia się stylu artysty na podstawie obrazu. Przykładem takiego narzędzia jest Glaze [Shan et al, 2023] stworzony przez Shawn Shan na Uniwersytecie Chicago. Narzędzie to dodaje do obrazów szum, który nie zmienia ich w znacznym stopniu z perspektywy człowieka, jednak znacząco utrudnia pracę modelom opartym o stable diffusion.
Narysuj mi Puszki Warhola
Artyści czerpią inspiracje z istniejących już dzieł i nurtów, analizują je, dokonują syntezy i w efekcie tworzą własne dzieła, które są połączeniem poznanych przez nich konceptów i własnego pierwiastka. W przypadku SI sprawa wygląda podobnie, z tą różnicą, że SI własne dzieła tworzy w kilka sekund, a nie jak to ma miejsce przypadku ludzi – miesięcy. Modele generatywne mają również zdecydowanie mniejsze opory przed plagiatowaniem dzieł które już poznały. W efekcie nic nie stoi na przeszkodzie, żeby poprosić SI o wygenerowanie obrazów w stylu tu wstaw nazwę swojego ulubionego artysty. Wobec tego, łatwo wyobrazić sobie sytuację, w której artysta zostanie wygryziony przez model uczony na jego własnych dziełach.
W ramach eksperymentu, poprosiliśmy SI o wygenerowanie obrazu podobnego do słynnej puszki z z zupą firmy Campbell. Biorąc pod uwagę, że poświęciliśmy na to dosłownie minutę, to efekt jest powalający. Czy jednak Andy Warhol byłby zadowolony z tego, że każdy może dziś stworzyć swoją wersję jego obrazu bez żadnego wysiłku?
Kto jest autorem obrazów stworzonych przez SI?
Ciekawym zagadnieniem jest również kwestia praw autorskich związanych z obrazami wygenerowanymi przez SI. Obecne prawo jasno stwierdza, że SI nie może być uznane za twórcę w rozumieniu praw autorskich. Według art. 1. ustawy o Prawach autorskich:
Przedmiotem prawa autorskiego jest każdy przejaw działalności twórczej o indywidualnym charakterze (…)
Według rzeczoznawców (prof. Ryszard Markiewicz – Wydział Prawa i Administracji Uniwersytetu Jagiellońskiego) samo wpisywanie promptów nie jest wystarczające do zaklasyfikowania powstałego obrazu jako utworu.
Obecnie istnieją różne koncepcje odnośnie tego jak rozwiązać problem uregulowania praw autorskich do dzieł stworzonych przez SI:
- Uznanie SI jako kreatywnego pracownika. Wówczas prawa autorskie do obrazów wygenerowanych przez SI (jak i odpowiedzialność z nimi związana) należałyby do podmiotów korzystających i czerpiących korzyści z SI.
- Wpisanie treści stworzonych przez SI do domeny publicznej. Wadą takiego rozwiązania jest jednak to, że powstałe obrazy mogą czerpać z dzieł objętych prawami autorskimi na których uczyła się SI.
- Stworzenie osobnego systemu prawnego tylko i wyłącznie dla robotów i SI. Niektórzy sugerują również stworzenie międzynarodowej fundacji przeznaczonej tylko do SI, która posiadałaby wszystkie majątkowe prawa autorskie z nią związane.
A co na to wszystko zwykli ludzie (albo trolle)?
Temat praw autorskich w odniesieniu do prac generowanych przez SI jest również często poruszany w social-mediach, czego przykładem jest znaleziony przez nas post na Facebooku krytykujący wykorzystywanie SI przez muzyków chcących niskim kosztem wygenerować okładki swoich płyt.
Wywołał on dość sporą dyskusję w komentarzach pomiędzy entuzjastami i przeciwnikami używania tego typu narzędzi. W gąszczu komentarzy znaleźć można było ciekawe argumenty wypowiadane przez obie strony. Przykładowo jeden użytkownik napisał:
Dosłownie każdy żyjący artysta jest plagiatorem. Wszyscy skądś biorą inspiracje i wielu z nich bezpośrednio kopiuje artystów, którzy istnieją od zawsze.
Nic już nie jest oryginalne.
Zgodnie z tą logiką nic nigdy nie było „oryginalne”. Co jest w porządku. Twórczość człowieka to mozaika naszej przeszłości, emocji i inspiracji. To, co robi sztuczna inteligencja, nie jest ani trochę podobne.
zapłać 1000 dolców za okładkę albumu, który zarobi 0,72 centa na Spotify
Tacy twórcy często nie zarabiają wiele na swojej sztuce. Wobec koszt stworzenia okładki albumu może być zbyt duży dla garażowego zespołu pasjonatów. SI w tym świetle prezentuje się jako tańsza alternatywa. Kolejną linią obrony SI było argumentowanie, że jest ona po prostu konsekwencją rozwoju ludzkości, a chęć artystów do bycia jedyną grupą mogącą tworzyć sztukę jest sprzeczna z interesem ogółu:
Wyobraź sobie, że wściekasz się na kalkulatory, bo mamy matematyków
Inni użytkownicy wskazywali na używanie dzieł artystów do trenowania SI bez ich zgody, co interpretować można jako kradzież własności intelektualnej. Zwracali oni też uwagę, że rozwój SI może wpłynąć negatywnie na rozwój branży kreatywnej:
Sztuczna inteligencja kradnie artykuły, dokumenty, zdjęcia, rysunki, muzykę itp. Tylko ktoś, kto nie wie, jak wykazać się kreatywnością, broniłby wykorzystania sztucznej inteligencji.
Słusznie zwrócono też uwagę na brak istnienia odpowiednich narzędzi prawnych do rozstrzygania sporów związanych z SI:
To trochę przerażające, że nawet aktorzy głosowi mogą śpiewać moje ulubione piosenki. Absolutnie musimy uczynić sztuczną inteligencję branżą, która w Ameryce jest regulowana aż do granic możliwości.
Powyższe przykłady dobrze ilustrują to, że temat jest niezwykle kontrowersyjny i każda ze stron posiada dobre argumenty za lub przeciw SI.
Słowo podsumowania
SI jest niezwykle potężnym narzędziem, dzięki któremu wiele osób nie mających talentu i wystarczająco dużo czasu jest w stanie przelać swoje idea na monitory komputerów. Jest ono częścią nowej rzeczywistości, której nie możemy ignorować. Nam samym zdarza się używać generatorów SI do tworzenia memów, czy też chociażby grafik do tego wpisu. Gdyby nie było SI, to nie zatrudniono by do tych celów artysty, ponieważ byłaby to gra nie warta świeczki, a więc wspomniane memy nigdy by nie powstały. Czy jednak taką samą logiką powinny kierować się duże korporacje przy tworzeniu kampanii reklamowej? Prawdopodobnie nie. Zapotrzebowanie na artystów nie przestanie istnieć. Jakościowa sztuka powinna się obronić na tle powtarzalnych grafik tworzonych przez SI. Konieczne jest jednak wdrożenie odpowiednich przepisów chroniących artystów i zadbanie o to, by osoby “karmiące” SI swoimi obrazami same nie przymierały z głodu.
Źródła
- How does Stable Diffusion work?
- Kai-Qing Zhou, Hatem Nabus – The Ethical Implications of DALL-E: Opportunities and Challenges, 2023
- Shawn Shan et al – Glaze: Protecting Artists from Style Mimicry by Text-to-Image Models, 2023
- Harry Jiang et al. – AI Art and its Impact on Artists, 2023
- Oliver Bendel – Image synthesis from an ethical perspective, 2023
- Czy SI może być autorem treści, które generuje?
- Generative AI Has an Intellectual Property Problem
- Akt ws. sztucznej inteligencji: pierwsze przepisy regulujące sztuczną inteligencję
- AI and Artists’ IP: Unpacking Copyright Infringement Allegations in Andersen v. Stability AI Ltd.
Świetny artykuł! Bardzo dokładnie opisuje zarówno szanse, jak i wyzwania związane z wprowadzeniem kryptowalut, NFT i technologii blockchain do współczesnej…