Home » AGH 2024/25 » Rekonstrukcja stylów malarskich przy użyciu uczenia maszynowego – jak AI potrafi analizować i generować obrazy inspirowane technikami mistrzów, od Rembrandta po Beksińskiego

Tagi

Wyróżnione posty

Zobacz też

Statystyki

  • 524
  • 6 599
  • 36 922
  • 12 060
  • 49

Rekonstrukcja stylów malarskich przy użyciu uczenia maszynowego – jak AI potrafi analizować i generować obrazy inspirowane technikami mistrzów, od Rembrandta po Beksińskiego

Spread the love

Co czyni sztukę sztuką? Intencja? Emocja? A może tylko sposób, w jaki ją odbieramy? Gdy algorytmy uczą się kształtować formę i naśladować ludzką wrażliwość, pytania o granice twórczości stają się nieuniknione. Dzięki technikom uczenia maszynowego możliwe staje się odtwarzanie stylów malarskich, analiza dzieł i generowanie obrazów, które przypominają prace prawdziwych mistrzów.

Przez stulecia sztuka malarska była postrzegana jako domena człowieka – przestrzeń, w której wyobraźnia i własne przeżycia stanowią fundament procesu twórczego. Za pośrednictwem tradycyjnych narzędzi artyści tacy jak Rembrandt, Vincent van Gogh, czy Zdzisław Beksiński kształtowali historię estetyki, pozostawiając po sobie dziedzictwo stylów i form wyrazu. Dziś jednak sztuczna inteligencja (AI) wychodzi poza proste analizy statystyczne i wkracza na obszar ekspresji artystycznej.

W ostatnich latach rozwój metod głębokiego uczenia, zwłaszcza konwolucyjnych sieci neuronowych (CNN), umożliwił tworzenie modeli zdolnych nie tylko do zrozumienia techniki, ale także do generowania obrazów imitujących konkretne style malarskie. Jednym z najbardziej znanych sposobów na osiągnięcie tego efektu jest tzw. „style transfer” (przenoszenie stylu), który polega na rozdzieleniu obrazu na warstwę treści (np. kształty i kompozycję) oraz warstwę stylu (kolorystyka, faktura, pociągnięcia pędzla), a następnie ich rekombinacji w nową formę zawierającą cechy obu obrazów.

Styl, sztuka i maszyny – krótka historia

Badania nad automatycznym przenoszeniem stylu malarskiego z jednego obrazu na inny nabrały tempa wraz z rozwojem metod głębokiego uczenia, w szczególności konwolucyjnych sieci neuronowych, które doskonale sprawdzają się w przetwarzaniu obrazów. Punktem przełomowym była praca Gatysa, Eckera i Bethge’a (2015), w której naukowcy wykazali, że sieć neuronowa może „nauczyć się” rozdzielać cechy treściowe i stylistyczne obrazu.

Z technicznego punktu widzenia, transfer stylu polega na przetworzeniu dwóch obrazów: jednego, który zawiera treść (np. zdjęcie miasta), oraz drugiego, który dostarcza stylu (np. obraz olejny z charakterystycznymi pociągnięciami pędzla). Sieć analizuje oba obrazy na różnych poziomach abstrakcji. Treść obrazu reprezentowana jest przez aktywacje z środkowych warstw sieci, które „rozpoznają” strukturę, kompozycję i formy. Styl natomiast jest opisywany poprzez macierze Grama, czyli autokorelacje pomiędzy aktywacjami filtrów w zarówno niższych, jak i wyższych warstwach.

Przykład stylizacji obrazu metodą Gatysa. Leon A. Gatys, Alexander S. Ecker, & Matthias Bethge. (2015). A Neural Algorithm of Artistic Style. Obraz użyty w celach edukacyjnych.
Przykład stylizacji obrazu metodą Gatysa. Leon A. Gatys, Alexander S. Ecker, & Matthias Bethge. (2015). A Neural Algorithm of Artistic Style. Obraz użyty w celach edukacyjnych.

Te macierze mierzą, jak silnie różne cechy (np. tekstury, kolory, lokalne wzory) współwystępują w danym obrazie. W uproszczeniu – to nie konkretna linia czy kolor definiuje styl, ale sposób, w jaki różne cechy „rozmawiają” ze sobą w przestrzeni obrazu. Ta relacja między filtrami jest matematycznym odwzorowaniem charakterystycznej atmosfery obrazu: jego pociągnięć pędzla, ziarnistości, rozmyć czy kontrastów.

 

Schemat blokowy przenoszenia stylu
Schemat blokowy przenoszenia stylu By Zhang, Aston and Lipton, Zachary C. and Li, Mu and Smola, Alexander J. – https://github.com/d2l-ai/d2l-en, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=152265662 Obraz użyty w celach edukacyjnych.

Na podstawie tych danych tworzony jest nowy obraz, który zachowuje treść zdjęcia, ale odwzorowuje współzależności charakterystyczne dla stylu drugiego obrazu. Proces ten opiera się na optymalizacji – sieć stopniowo modyfikuje obraz wyjściowy tak, aby jego „cechy stylu” (czyli korelacje) upodobniły się do oryginału, przy jednoczesnym zachowaniu treści.

Choć koncepcja wydaje się skomplikowana, efekty tej techniki stały się szybko dostępne w aplikacjach i narzędziach online, które umożliwiają użytkownikom tworzenie stylizowanych obrazów w ciągu kilku sekund. Co istotne, oryginalna metoda Gatysa nie wymagała trenowania nowej sieci neuronowej dla każdego stylu. Zamiast tego wykorzystywała już istniejącą, pretrenowaną sieć VGG-19, która pierwotnie została zaprojektowana do klasyfikacji obrazów – rozpoznawania obiektów na zdjęciach.

Wyniki stylizacji obrazu metodą Gatysa. Leon A. Gatys, Alexander S. Ecker, & Matthias Bethge. (2015). A Neural Algorithm of Artistic Style. Obraz użyty w celach edukacyjnych.
Wyniki stylizacji obrazu metodą Gatysa. Leon A. Gatys, Alexander S. Ecker, & Matthias Bethge. (2015). A Neural Algorithm of Artistic Style. Obraz użyty w celach edukacyjnych.

To, że sieć stworzona do zupełnie innego zadania mogła posłużyć do wydobywania cech stylu i treści, pokazało uniwersalność głębokich reprezentacji w konwolucyjnych sieciach neuronowych. Styl można było „pobrać” z dowolnego obrazu i zastosować go do innej treści bez potrzeby uczenia nowego modelu, co czyniło tę metodę wyjątkowo elastyczną, dostępną i łatwą do eksperymentowania – zarówno dla badaczy, jak i entuzjastów cyfrowej sztuki.

W kolejnych latach społeczność naukowa nie tylko rozwijała koncepcję przenoszenia stylów, ale również poszukiwała sposobów, by uczynić cały proces bardziej wydajnym. Metoda zaproponowana przez Johnson, Alahi i Fei-Fei (2016) zrewolucjonizowała podejście, przyśpieszając proces transferu stylu. Zamiast każdorazowo optymalizować nowy obraz (jak u Gatysa), naukowcy zaproponowali trenowanie osobnej sieci neuronowej dla każdego konkretnego stylu. Dzięki temu proces generowania nowego obrazu ograniczał się do jednego przejścia danych przez sieć (tzw. forward pass), co umożliwiło tworzenie stylizowanych obrazów w czasie rzeczywistym – nawet na urządzeniach mobilnych.

Ta zmiana otworzyła drogę do praktycznych zastosowań: od aplikacji artystycznych po filtry w mediach społecznościowych. Minusem było ograniczenie elastyczności – każda sieć działała tylko dla jednego stylu, więc aby stworzyć obrazy w nowej estetyce, należało wytrenować osobny model.

Dynamiczny rozwój metod stylizacji obrazu pokazuje, że sztuczna inteligencja potrafi nie tylko odwzorowywać, ale wręcz tworzyć obrazy o wyraźnych cechach estetycznych, często trudnych do odróżnienia od dzieł ludzkich artystów. Wraz z tą zdolnością pojawia się jednak pytanie o charakter i jakość takiej twórczości. Czy mamy do czynienia z nową formą sztuki – czy raczej z jej zaawansowaną imitacją?

Analiza problemu: „Sztuka” czy symulacja sztuki?

Dzisiejsze narzędzia oparte na sztucznej inteligencji są w stanie tworzyć obrazy niemal do złudzenia przypominające dzieła najwybitniejszych autorów. Powstają zatem zasadnicze pytania: czy taka „automatyczna” produkcja sztuki jest w ogóle twórcza i czy można ją uznać za nową formę ekspresji?

Z jednej strony, AI nie doświadcza świata tak, jak człowiek. Nie przeżywa emocji, które kierują ręką artysty w trakcie malowania. Z drugiej strony, argument o „oryginalności” człowieka jako twórcy również nie jest bezdyskusyjny. Proces przetwarzania bodźców wzrokowych w mózgu oraz kształtowanie się indywidualnego stylu to także „system”, oparty na strukturach neuronowych, które – analogicznie do sieci sztucznej – analizują i przetwarzają dane.

Wielu badaczy wskazuje, że AI w praktyce może spełniać funkcję katalizatora nowych idei. Podczas gdy artysta wybiera styl, motyw, zestaw farb, w systemach uczenia maszynowego dokonuje się selekcja wzorców i cech graficznych, które nadają kompozycji niepowtarzalnego charakteru. Istnieje tu element zaskoczenia, nieprzewidywalności, a nawet błędu, który może skutkować powstaniem prawdziwie unikatowego dzieła, wyrastającego ponad proste kopiowanie.

Krytyczne spojrzenie na wartość „nowej sztuki”

Od strony stricte artystycznej, wiele osób pozostaje sceptycznych wobec twórczości generowanej przez AI. Padają argumenty, że algorytmy nie mają duszy, nie mają też osobistego celu, nie przetwarzają realnych emocji – a sztuka to w dużej mierze nośnik przeżyć. Można również spotkać się z opinią, że generatory stylu po prostu „wyłuskują” powtarzalne wzory, a więc w pewnym sensie kalkują to, co już istnieje.

Z drugiej jednak strony, systemy takie jak Creative Adversarial Networks (Elgammal, Liu, Elhoseiny & Mazzone, 2017) potrafią tworzyć obrazy, które wykraczają poza ramy stylów zdefiniowanych przez człowieka. W przeciwieństwie do klasycznych modeli generatywnych, które próbują naśladować określony styl (np. impresjonizm czy surrealizm), CAN zostały zaprojektowane tak, by świadomie „zbaczać” ze znanych szlaków. Ich architektura opiera się na klasycznym układzie GAN (Generative Adversarial Network), w którym dwa modele – generator i dyskryminator – współzawodniczą ze sobą: jeden tworzy obrazy, drugi ocenia ich jakość.

W przypadku CAN dyskryminator nie tylko ocenia, czy wygenerowany obraz wygląda jak dzieło sztuki, ale również klasyfikuje go według stylu (np. barok, ekspresjonizm, pop-art). Zadaniem generatora jest zatem stworzenie obrazu, który zostanie uznany za „sztukę”, ale którego styl nie będzie łatwy do jednoznacznego sklasyfikowania. Innymi słowy – system uczy się produkować coś, co wygląda artystycznie, ale jednocześnie wprowadza innowację stylistyczną.

To podejście można rozumieć jako próbę symulacji procesu twórczego, w którym artysta nie powiela tego, co znane, lecz świadomie poszukuje nowego języka wizualnego. AI może na przykład łączyć elementy charakterystyczne dla Beksińskiego, Goyi i sztuki street artu, tworząc nową, hybrydową formę ekspresji. Takie zestawienia nie wynikają z zaprogramowanego schematu, lecz z wewnętrznej logiki modelu, który „uczy się”, że warto eksperymentować, by zaskakiwać odbiorcę.

Jeśli celem sztuki jest zadawanie pytań, prowokowanie, przełamywanie schematów czy proponowanie nieoczywistych rozwiązań wizualnych – to czy AI, ucząca się przez kontestowanie znanych stylów, nie wpisuje się w tę definicję równie dobrze jak człowiek?

Społeczne i etyczne dylematy

Czy generowanie obrazów w stylu konkretnego artysty jest równoznaczne z naruszeniem jego praw autorskich? Kwestia ta jest szczególnie złożona w przypadku artystów współczesnych i żyjących, gdzie przenoszenie stylu może prowadzić do de facto podszywania się pod czyjś autorski i rozpoznawalny warsztat. Choć w wielu systemach prawnych styl nie jest chroniony tak, jak sam utwór, to jednak wrażliwość etyczna nakazuje ostrożność.

Skoro kopiowanie stylu może wpływać na dochody artystów, a obecne prawo nie przewiduje ochrony dla samego „warsztatu”, pojawia się potrzeba nowych mechanizmów rekompensaty. Inspiracją mogą być tu istniejące już rozwiązania, takie jak opłata reprograficzna – forma odszkodowania dla twórców, która uwzględnia możliwość legalnego kopiowania ich dzieł (np. poprzez kserowanie książek czy zapisywanie plików na nośnikach). W podobny sposób mogłaby funkcjonować opłata „sztucznointeligencyjna” – niewielki narzut na narzędzia generatywne lub komercyjne modele AI, z którego finansowano by fundusz dla artystów, których styl jest wykorzystywany.

Potrzeba takiej rekompensaty staje się szczególnie widoczna w kontekście masowej produkcji obrazów przez AI. Nadprodukcja dzieł generowanych algorytmicznie może prowadzić do realnego spadku wartości rynkowej oryginałów, zwłaszcza w sektorze ilustracji cyfrowej, plakatów czy grafik użytkowych. Niektórzy komentatorzy mówią wręcz o „inflacji sztuki” – jeśli w kilka minut można wygenerować setki stylizowanych prac „w duchu Van Gogha” czy „inspirowanych Beksińskim”, to nieuchronnie prowadzi to do dewaluacji zarówno samego aktu tworzenia, jak i wartości kolekcjonerskiej dzieł.

Zastosowanie sztucznej inteligencji w sztuce nie ogranicza się wyłącznie do przenoszenia stylów malarskich. Algorytmy uczenia maszynowego znajdują również zastosowanie w rekonstrukcji zniszczonych dzieł oraz w ochronie i odtwarzaniu technik artystycznych, które z biegiem lat zanikły. W wielu muzeach na świecie prowadzone są projekty badawcze, które wykorzystują sieci neuronowe do automatycznej „naprawy” ubytków w płótnie, odtwarzania brakujących fragmentów fresków czy przywracania oryginalnej kolorystyki zniszczonych obrazów. Modele te uczą się na bazie setek lub tysięcy dzieł z danej epoki, pozwalając konserwatorom uzyskać wgląd w to, jak mogło wyglądać dzieło w chwili powstania.

Takie cyfrowe wsparcie nie zastępuje tradycyjnych metod konserwatorskich, ale może je znacząco uzupełnić, oferując nowe narzędzia do pracy z materiałem wizualnym. Co więcej, możliwość przeniesienia stylu konkretnego artysty i zastosowania go do współczesnych obrazów, może pełnić funkcję edukacyjną i popularyzatorską. Dla szerokiej publiczności jest to okazja, by na nowo zetknąć się z estetyką dawnych mistrzów, a dla instytucji kultury – nowoczesna forma promowania dziedzictwa artystycznego. W tym kontekście AI może być nie tylko narzędziem twórczym, ale również sprzymierzeńcem w walce o pamięć i ciągłość kulturową. To właśnie dzięki sztucznej inteligencji wiele osób po raz pierwszy zainteresowało się historią sztuki i stylami dawnych mistrzów. Dzięki popularnym aplikacjom przenoszącym styl można w atrakcyjny sposób zaprezentować dziedzictwo malarstwa nowym pokoleniom, pokazując, że sztuka nie jest jedynie statycznym zbiorem eksponatów w muzeum, lecz żywym organizmem, który można interpretować i przetwarzać na wiele sposobów.

Konkluzja

Rekonstrukcja stylów artystycznych przy użyciu uczenia maszynowego stawia przed nami zarówno fascynujące możliwości, jak i złożone wyzwania. Z jednej strony, systemy AI oferują innowacyjne narzędzia, które mogą wzbogacać proces twórczy, ratować zniszczone dzieła czy popularyzować wiedzę o malarstwie i jego historii. Z drugiej strony, pojawia się niepokój o to, czy w nadmiarze łatwo generowanej „sztuki” nie utracimy esencji ludzkiego doświadczenia, które przez wieki stanowiło sedno artystycznego przekazu.

Wobec tych wyzwań konieczne jest prowadzenie dalszych badań nad możliwościami i ograniczeniami AI w sztuce, a także wypracowanie ram etycznych i prawnych, które będą chronić interesy twórców i odbiorców sztuki. Warto, abyśmy nie traktowali maszynowego naśladowania stylów malarskich wyłącznie jako neutralnego narzędzia; to także przestrzeń, w której definiujemy na nowo sens kreacji, inspiracji i oryginalności.

Bez względu na przyjętą perspektywę, dyskusja o wartości i przyszłości sztuki tworzonej przez AI dopiero się rozpoczyna. Każdy kolejny postęp w dziedzinie uczenia maszynowego otwiera nas na nowe pytania, a zarazem prowokuje do reinterpretacji starych pojęć, takich jak „talent”, „geniusz” czy „intencja”. Przed nami zatem ciekawy, choć niepozbawiony kontrowersji, rozdział w historii relacji między człowiekiem, maszyną i sztuką.

Literatura

Bostrom, N. (2005). Transhumanist values. Journal of philosophical research30(Supplement), 3-14.

Johnson, J., Alahi, A., & Fei-Fei, L. (2016). Perceptual losses for real-time style transfer and super-resolution. In Computer Vision–ECCV 2016: 14th European Conference, Amsterdam, The Netherlands, October 11-14, 2016, Proceedings, Part II 14 (pp. 694-711). Springer International Publishing.

Gatys, L. A., Ecker, A. S., & Bethge, M. (2015). A neural algorithm of artistic style. arXiv preprint arXiv:1508.06576.

Gatys, L. A., Ecker, A. S., & Bethge, M. (2016). Image style transfer using convolutional neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 2414-2423)

Elgammal, A., Liu, B., Elhoseiny, M., & Mazzone, M. (2017). Can: Creative adversarial networks, generating” art” by learning about styles and deviating from style norms. arXiv preprint arXiv:1706.07068.

Wang, B., Chen, Q., & Wang, Z. (2024). Diffusion-based visual art creation: A survey and new perspectives. arXiv preprint arXiv:2408.12128


Leave a comment

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Najnowsze komentarze

  1. W kwestii obrony przed nadużywaniem metod z tej rodziny przy stawianiu oskarżeń, jako pewne rozwinięcie tematu mogę polecić przesłuchanie w…

  2. Tak, początek artykułu to świadoma ironia nawiązująca do propagandowej mowy (swoją drogą, ciekawe, czy ChatGPT zdawał sobie z tego sprawę,…

  3. Dzięki za uwagę! Sama też chętnie zobaczyłabym konkretne metryki. Natomiast: 1. Generalnie nie są publicznie udostępniane w całości, szczególnie jeśli…