Wraz z gwałtownym rozwojem w dziedzinach Data Science i Sztucznej Inteligencji (SI) pojawiają się niespotykane dotąd możliwości zastosowań przetwarzania danych w celach artystycznych i kreatywnych. Jakie rozwiązania już funkcjonują i jakie są dalsze możliwości? Jakie i gdzie pojawiają się obecnie ograniczenia? I w końcu czy komputery mogą w sposób autonomiczny tworzyć sztukę?
Czym jest kreatywność?
Kreatywność jest jedną z fundamentalnych cech umysłu ludzkiego, spokrewnioną lecz nie tożsamą z inteligencją i wciąż skrywającą wiele tajemnic. Ma ona wymiar zarówno poznawczy, jak i związany z motywacją i emocjami. Istnieją dziesiątki – jeśli nie setki – alternatywnych definicji pojęcia kreatywności, a badacze z różnych dziedzin, od psychologii po informatykę, starają się ją zrozumieć. Panuje powszechna zgoda, że aby móc nazwać daną ideę kreatywną, musi ona być nowatorska, zaskakująca, wartościowa i użyteczna.
O kreatywności, w kontekście jej nowatorskości, można ponadto mówić w dwóch sensach: psychologicznym i historycznym. W sensie psychologicznym (indywidualnym) o idei można powiedzieć, że jest nowatorska (a zatem jest wynikiem zadziałania kreatywności) wtedy, kiedy u danego człowieka owa idea pojawiła się po raz pierwszy i nie mogła pojawić się wcześniej. Sens historyczny zaś za nowatorską uważa ideę, która pojawiła się po raz pierwszy w historii ludzkości. Definicja w kontekście sensu historycznego wydaje się być węższą (stanowiącą specjalny przypadek kreatywności psychologicznej) i zdecydowanie bardziej gloryfikowaną w społeczeństwie, co ma swoje odzwierciedlenie w sposobie przypisywania autorstwa odkryciom naukowym i patentom. Pojawiają się tutaj oczywiście problemy związane ze stawianiem granicy określającej kiedy dana idea jest identyczna z drugą i jak bardzo dwie idee muszą się różnić, by można było stwierdzić, że są one prawdziwie odrębne.
Na kreatywność można patrzeć z dwóch perspektyw. Pierwsza traktuje ją jako złożenie istniejących już elementów, które powoduje pojawienie się czegoś nowatorskiego w sensie wystąpienia lub utrwalenia tego po raz pierwszy (w wyniku zasad generatywnych, które służyły już do tworzenia podobnych artefaktów) i często posiadającego niespodziewane właściwości. Należy przy tym pamiętać, że taki nowy wytwór, by można było określić go mianem czegoś prawdziwie kreatywnego, musi dodatkowo być użyteczny, oświecający lub w taki lub inny sposób kwestionować dotychczasowe status quo.
Innym spojrzeniem na tę kwestie jest rozpatrywanie nowatorskości rozumiane w sposób radykalny, czyli nowatorskości, której nie da się uzyskać poprzez wykorzystanie istniejących już obiektów bądź reguł i określa się je mianem ex nihilo. W podejściu tym przyjmuje się, że nowatorskość będącą wynikiem kreatywnego działania może pojawić się tylko i wyłącznie w następnie specjalnego tudzież magicznego wręcz bodźca, jak boskie sprawstwo.
Oczywiście istnieje wiele innych definicji, co jedynie do utwierdzenia w przekonaniu, że trudno jest jednoznacznie zdefiniować kreatywność nawet w odniesieniu do ludzi, co naturalnie prowadzi do jeszcze większych kłopotów z definiowaniem jej w przypadku komputerów. Tym samym także ocena czy komputer rzeczywiście przejawia oznaki kreatywności jest zadaniem nietrywialną.
Rodzaje kreatywności generatywnej
Można mówić o trzech rodzajach generowania nowatorskich idei. Wszystkie one prowadzą do nowatorskości, ale w różnym stopniu.
Pierwszy rodzaj, nazywany kreatywnością kombinacyjną, to łączenie istniejących już idei w nowy, nieoczywisty sposób i można się z nim zetknąć np. w poezji, gdzie pojawiają się nieoczekiwane połączenia wyrazów.
Drugim rodzaj, nazywany kreatywnością eksploracyjną, to generowanie nowych idei poprzez eksplorację ustrukturyzowanych przestrzeni koncepcyjnych, w wyniku której powstają idee nowatorskie i niespodziewane.
Trzeci rodzaj, nazywany kreatywnością transformacyjną, opiera się o modyfikację wymiaru lub wymiarów rozpatrywanej przestrzeni, co z kolei umożliwia tworzenie nowych struktur, których nie można było uzyskać przed transformacją. Im bardziej fundamentalny poziom transformacji i im bardziej radykalna ona jest, tym bardziej zaskakujące powstałe w ten sposób idee.
Jeśli chodzi o kreatywne wytwory komputera, to mowa tutaj o kreatywności rozumianej w sensach generatywnym, a wszystkie jego wytwory są generowane przez zbiór obliczeniowych zasad w komputer wbudowany, co może budzić niepokój w odniesieniu do pytania, czy wytwory obecnych komputerów są wytworami prawdziwie kreatywnymi. Wydaje się jednak, że generatywne podejście do kreatywności ma swoje ograniczenia i być może nie definiuje ono najwyżej formy kreatywności, jeżeli kreatywność w ogóle można stopniować.
Wracając jednak do tego, co potocznie uznawane jest za działalność kreatywną, można z łatwością dostrzec znaczny rozwój i wzrost znaczenia systemów komputerowych opartych o to, co współcześnie określa się mianem sztucznej inteligencji, w szczególności oczywiście mowa tutaj o rozwiązania opartych o sieci neuronowe.
Czy sztuczna inteligencja może być kreatywna?
Żaden człowiek nie rodzi się z umiejętnością pisania, malowania czy rzeźbienia. Podobnie w przypadku SI wydaje się, że tych zdolności komputer należy nauczyć. W teorii, mając odpowiednio duży zbiór danych (np. wierszy lub obrazów) i wykorzystując je do trenowania algorytmów uczenia maszynowego (obecny złoty standard), SI może wychwycić występujące w danych wzorce i regularności i w oparciu o nie wymyślić własne. I rzeczywiście – w związku z gwałtownym wzrostem ilości dostępnych danych i mocy obliczeniowej w ostatnich latach SI weszło na obszary, o których wcześniej myślano jako o zarezerwowanych wyłącznie dla ludzi. Jednak pomimo znacznego postępu, SI obecnie wciąż pełni rolę raczej inteligentnego narzędzia wspomagającego ludzką kreatywność, a nie samodzielnego twórcy. Oto przegląd obszarów, w których SI zwiększa kreatywność twórców.
Sztuka wizualna
W przypadku sztuk wizualnych SI wywarła bardzo duży wpływ. Pojawiły się sieci neuronowe generujące obrazy imitujące styl znanych mistrzów, koloryzujące czarno-białe filmy i fotografie, przekształcające klasyczne portrety w ich animowane odpowiedniki, pozwalające podmieniać twarze w klasycznych filmach (Deepfake) i generujące realistyczne lub abstrakcyjne obrazy na podstawie tekstu. Ciekawym wydarzeniem było wystawienie na aukcji przez Christie’s wygenerowanego przez SI portretu Edmonda de Belamy za zawrotną kwotę ponad 400 tysięcy dolarów. Sieć GAN, która stworzyła to dzieło, została wytrenowana na zbiorze liczącym około 15 tysięcy portretów obejmujących dzieła z okresu sześciu wieków. SI wykorzystywane jest również na różne sposoby przez filmowców, gdzie jednym z zastosowań jest automatyczne tworzenie trailerów, jak miało to miejsce np. w 2016 roku, gdzie Watson od IBM-u w pełni samodzielnie stworzył trailer do filmu pt. Morgan.
Muzyka
Duży postęp miał miejsce również w obszarze muzyki. Ciekawym przykładem są prace Davida Cope’a, któremu udało się stworzyć algorytmy zdolne do generowania muzyki różnych gatunków.
Wielu innych współczesnych twórców korzysta ze wsparcia, jakie oferuje SI. Tworzeni są wirtualni kompozytorzy, którym przypisuje się posiadanie własnego stylu. SI wykorzystywane jest również do analizy panującej mody i nastrojów w celu jak najlepszego trafienia w gusta słuchaczy. Interesującym wydarzeniem było stworzenie przez interdyscyplinarna grupę badaczy złożoną z muzykologów, historyków i kompozytorów SI, która dokończyła X Symfonię Bethovena, imitując styl mistrza i posiłkując się jej wstępnymi szkicami.
Pisanie
SI przekształca również takie obszary jak pisanie powieści, poezji czy artykułów naukowych. Język naturalny ciągle wydaje się sporym wyzwaniem dla SI – nawet pomimo dostępności olbrzymiej przecież ilości danych, ale postęp jest widoczny. Artykuły pisane przez SI publikowane były już na łamach takich pism jak The Guardian. W Japonii krótka powieść wygenerowana przez SI była bliska zwycięstwa w narodowym konkursie pisarskim. Istnieją również rozwiązania, które na podstawie jednego słowa są w stanie wygenerować wiersz. Ciekawy jest też przykład profesora Philipa Parkera, który stworzył system, będący w stanie w ciągu 20 minut napisać książkę na zadany temat. W ten sposób powstały już setki tysięcy publikacji za sprawą tylko tego jednego algorytmu.
SI pomaga też naukowcom, choć na razie w nieco mniej spektakularny sposób. Dostępne są narzędzia przyśpieszające tworzenie publikacji przez odpowiednie sugestie pomagające usprawnić stylistykę i gramatykę tekstu, a także pomagające ustrzec się przed plagiatem.
Projektowanie
SI znajduje zastosowanie także w szeroko pojętnym projektowaniu komercyjnym. Służy ona tutaj głównie jako narzędzie przyśpieszające tworzenie nowych projektów, ale mają miejsce też ciekawsze wydarzenia, jak zaprezentowanie w 2019 na Milan Design Week krzesła, które zostało w całości zaprojektowane przez SI.
Choreografia
SI może być także wykorzystywane w tworzeniu i ulepszaniu choreografii i tańca. Wayne McGregor, utytułowany brytyjski reżyser i choreograf, jest współtwórcą algorytmu, który na podstawie setek godzin nagrań przedstawiających tancerzy nauczył się tańczyć. Narzędzia takie mogą pomóc w tworzeniu atrakcyjnych widowisk i usprawnić często mocno iteracyjny i powolny proces ich tworzenia.
Podsumowanie
Wielu ekspertów w dziedzinie SI jest zdania, że to co właśnie obserwujemy, to dopiero przedsmak tego, co czeka nas w najbliższych latach. Mimo imponującego rozwoju SI i jej zastosowań w kreatywnych obszarach, wciąż pozostaje aktualnym pytanie, czy jej dzieła mają faktycznie kreatywny charakter. Czy może ona rozpoznawać piękno? W jakim stopniu może posiadać swoje własne poczucie kreatywności? I w końcu czy SI może być kreatywna bez jakiegokolwiek nadzoru i wskazówek ze strony człowieka? Czy to w ogóle powinno być celem, nawet jeśli jest możliwe?
Niezależnie od odpowiedzi na te pytania, SI już udowodniła swoją niewątpliwą przydatność w wielu branżach związanych ze sztuką, i nawet jeśli jeszcze przez długi czas nie będzie w stanie osiągnąć kreatywności jaką wykazują się ludzie, to stanowi ona doskonałe ich uzupełnienie oferujące wiele korzyści i mogące z powodzeniem służyć artystom jako inspirujący asystent.
Źródła
M. A. Boden. Creativity and artificial intelligence. Artificial Intelligence, 103(1):347–356, 1998. Artificial Intelligence 40 years later.
https://www.akkio.com/post/can-artificial-intelligence-be-creative
https://www.ibm.com/watson/advantage-reports/future-of-artificial-intelligence/ai-creativity.html
https://www.theguardian.com/commentisfree/2020/sep/08/robot-wrote-this-article-gpt-3
https://singularityhub.com/2012/12/13/patented-book-writing-system-lets-one-professor-create-hundreds-of-thousands-of-amazon-books-and-counting
https://mashable.com/video/morgan-watson-ai-trailer
Świetny artykuł! Bardzo dokładnie opisuje zarówno szanse, jak i wyzwania związane z wprowadzeniem kryptowalut, NFT i technologii blockchain do współczesnej…