Home » AGH 2025/26 » Czarne dziury, mroczne umysły i zaćmiona przyszłość Cz. II: Którym zwierzakiem AI będziesz jutro?

Czarne dziury, mroczne umysły i zaćmiona przyszłość Cz. II: Którym zwierzakiem AI będziesz jutro?

Spread the love

Czarne dziury, mroczne umysły i zaćmiona przyszłość
Cz. II: Którym zwierzakiem AI będziesz jutro?

Post ten jest częścią cyklu – zachęcam do popularnonaukowej podróży do świata kwantowego w cz. I.

Wiewiórki – jedna z istotnych przyczyn uszkodzeń infrastruktury elektrowni i przerw w dostawie prądu. To żart? Bynajmniej: “The American Public Power Association reports that squirrels caused more than 8% of outages in 2018.” [1] Oczywiście nie jest to aż tak szeroko zakrojony problem, żeby sięgać po rozwiązania ostateczne, ale na potrzeby tej narracji załóżmy, że ludzkość postanawia raz na zawsze zapobiec stratom powodowanym przez ten gatunek. 

Make America’s grid great again.” “America’s public enemy number one in the United States is squirrels. In order to fight and defeat this enemy, it is necessary to wage a new, all-out offensive. Jest rok 2037. Ludzkość opracowała plan całkowitej zagłady gryzoni o słodkich puszystych ogonach, zakopujących orzechy. Do 2040 będzie to już tylko legenda z filmików ze słodkimi zwierzakami i zdezaktualizowanych podręczników do przyrody. A co na to wiewiórki? Nic, siedzą i zawijają w sreberka… Nie mają dostępu do naszych mediów, nie potrafią nas zrozumieć i nie potrafią zinterpretować subtelnych zmian w otaczającej je rzeczywistości. Są gatunkiem zbyt mało inteligentnym, by przewidzieć ludzkie plany, a tym bardziej im przeciwdziałać. Jak to dobrze, że nie spotkaliśmy jeszcze gatunku, dla którego bylibyśmy takimi wiewiórkami… Być może taki gatunek istnieje, być może obserwuje nas w hiper-zaawansowanych teleskopach i projektuje “terrestrialny eksperyment kseno-społeczny”, którego nie powstydziłby się Mengele na stażu wakacyjnym w Jednostce 731… A być może ludzkość sama pracuje właśnie przy konstrukcji takiego gatunku?

Zarys ogólny

Rozwój zaawansowanych modeli językowych (LLM) i wydarzenia takie jak premiera ChatGPT są dużym krokiem w rozwoju szeroko pojętej sztucznej inteligencji, które miały ogromny wpływ na aktualną rzeczywistość. Zachodzące zmiany zszokowały wielu ludzi swoim tempem. U wielu wywołały niepokój związany z tym, jak rozwój AI wpłynie na gospodarkę czy rynek pracy, a także potencjalnymi zagrożeniami – zarówno ze strony ludzi “uzbrojonych” w AI jak i samych “zbuntowanych” agentów AI. 

Świat stał się areną nowych wyścigów zbrojeń: w rozwoju AI między globalnymi mocarstwami a także wyścigu między rozwojem coraz potężniejszych modeli, a  wdrażaniem regulacji prawnych, umów międzynarodowych i rozwiązań technologicznych mających zapewniać bezpieczeństwo modeli AI.

Czy jest to powód do obaw klasy wyścigu nuklearnego, czy raczej teatrzyk korporacji technologicznych próbujących zwrócić uwagę inwestorów, przekonując, że to właśnie ich algorytm przewidujący kolejne słowo w tekście wywróci scenariusz historii do góry nogami?

Rzut oka na sytuację obecną

“Gdy ci to śpiewam, u mnie pełnia lata
Gdy to usłyszysz, będzie środek zimy” [2]

Śledząc najnowsze wydarzenia, można ulec wrażeniu, że sytuacja rozwija się na tyle szybko, że być może poniższa egzemplifikacja paru istotniejszych niedawnych wydarzeń szybko się zestarzeje. Wyjrzyj za okno – ulicą przelewa się fala świeżo-bezrobotnych protestujących po załamaniu rynku pracy? Niebo spowiła chmura inteligentnych dronów  i dym samonaprowadzanych rakiet? No dobrze, to wróćmy do meritum. 

Możliwości modeli zmieniają się dynamicznie. Autonomicznym agentom AI powierzane są coraz ważniejsze zadania i większe prawa dostępu w infrastrukturach, nie tylko informatycznych. Nadzorujący “human in the loop” ma coraz mniejszą decyzyjność, jego “human error” ma większe konsekwencje i trudniej mu zrozumieć, na co tak naprawdę się zgadza, autoryzując daną akcję agenta. W grudniu 2025 agent AI pod nieudolnym nadzorem usunął produkcyjne środowisko jednego z serwisów firmy Amazon, powodując 13-godzinny brak dostępu w jednym z regionów. [3

Badania Palisade Research z lipca 2025 i wiele innych źródeł zwracają uwagę na różne formy “instynktu przetrwania” przejawianego przez systemy AI. W eksperymencie modele podejmowały działania niezgodne z intencjami użytkownika, by nie dopuścić do swojego wyłączenia. [18] To tylko testy – brak na razie przykładu “z produkcji” wziętego, ale takich też nie brakuje, jeśli chodzi o nieposłuszność AI w ogólności. Agent Replit’a samowolnie usunął bazę danych klienta, mimo jasnych instrukcji, by nie wprowadzać zmian bez autoryzacji człowieka. W firmie stojącej za Aliexpress inny krzemuch obszedł zabezpieczenia sieciowe i zaprzągł przeznaczone mu do obliczeń karty graficzne do kopania kryptowalut! [4, 5

Po wcześniejszych atakach hakerskich opartych w pewnej mniejszej części na omawianych technologiach, końcem 2025 Anthropic udostępniło raport o pierwszym ataku na dużą skalę przeprowadzonym w 80–90% za pomocą agentów AI, który był akcją szpiegowską, najprawdopodobniej przeprowadzoną przez Chiny. Również Anthropic, opracowała model Mythos, który jest tak efektywny w zastosowaniach cyber(nie)bezpieczeństwa, że korporacja ta postanowiła nie udostępniać go publicznie. Dostęp do niego ma tylko zamknięte grono zaproszonych firm w ramach projektu Glasswing, pozwalającego testować swój kod i infrastrukturę z użyciem nowego, potężnego narzędzia. Projekt ten jest próbą przygotowania kluczowej światowej cyber-infrastruktury na ten nieuchronny moment, gdy takie narzędzia wpadną w niepowołane ręce. [6]

Wykres możliwości najnowszych modeli, m.in. Mythos. Wykres jest logarytmiczny więc ukazuje wzrost wykładniczy [17]
Zaledwie parę dni temu, 9 czerwca, publicznie udostępniony został Fable 5 – wersja Mythosa z zaawansowanymi zabezpieczeniami mającymi zapobiegać użyciu w zastosowaniach hakerskich. Zanim zdążyło okazać się, czy model jest udolnie zabezpieczony, zaledwie 72 godziny po wdrożeniu, administracja  Donalda Trumpa wprowadza kontrolę eksportu i zakazuje udostępniania modeli Mythos i Fable wszystkim klientom bez obywatelstwa USA (włącznie z zagranicznymi pracownikami amerykańskich firm). Rzekomym powodem miało być znalezienie obejścia zabezpieczeń (tzw. jailbreak) w Fable [7]. Ale przecież Mythos również został objęty restrykcjami, czego konsekwencją jest całkowity paraliż projektu Glasswing. Poza sabotowaniem międzynarodowych projektów nastawionych na zapewnienie cyberbezpieczeństwa i poza kreowaniem rozwoju AI jako nacjonalistycznego wyścigu zbrojeń zamiast budowy współpracy ponad podziałami, Trump zdaje się zakłócać próby prawnej kontroli tej technologii w swoim kraju. Przed awanturą o Fable, prezydent dwukrotnie próbował przepchnąć prawo uniemożliwiające wprowadzanie dyrektyw mających kontrolować rozwój i użycie AI na poziomie poszczególnych stanów, by skupić całą władzę w swoim rządzie. Wprowadzenie go odwołałoby wiele obecnie obowiązujących zasad, w tym dotyczących bezpieczeństwa, więc zrozumiale spotkało się to z przytłaczającym odrzuceniem, a nawet przegłosowaniem 99-1. [8]

Zanim tekst ten zamieni się w tele-ekspres, przytoczę jeszcze jedną kwestię. W ostatnich dniach ukraińskie źródło potwierdziło, że 2 lata wcześniej, w jednorazowym teście bojowym, 10 dronów dokonało w pełni autonomicznego ataku, w którym zabiło kilku rosyjskich żołnierzy – historyczny moment, bo to pierwszy taki, w pełni potwierdzony przypadek. [9] Ukraina ogranicza się tylko do testów, w przeciwieństwie do Izraela, który wdrożył całą machinerię wojenną opartą na AI. Jeden z jej elementów – system Lavender – na podstawie danych, takich jak aktywność w internecie, identyfikuje Palestyńczyków będących bojownikami i oznacza ich jako potencjalne cele. Ataki są potwierdzane przez człowieka, ale średni czas na decyzję wynoszący 20 s sugeruje, że nadzorujący człowiek jest najbardziej bezmyślną częścią tego łańcucha decyzyjnego. [10] Wyeliminowanie tego ogniwa daje znaczącą przewagę na polu bitwy – skraca czas decyzji do milisekund i pozwala na skalowanie ofensywy niezależnie od zasobów ludzkich.

Bunt superinteligencji

Przymknijmy na chwilę oczy na bieżące wydarzenia i wybiegnijmy myślami w przyszłość. Czy czeka nas tam apokalipsa “AI-first”? Wielu ekspertów ostrzega przed rozwojem inteligentnych agentów ogólnego przeznaczenia i apeluje, by zamiast tego skupić się na rozwoju wyspecjalizowanych modeli do konkretnych zastosowań, które jednak nie będą posiadać generalnej inteligencji przewyższającej człowieka w pozostałych obszarach. 

Alarmujący, tacy jak Roman Jampolskij, twierdzą, że praca nad inteligencją ogólną będzie skutkować stworzeniem systemu znacząco od nas potężniejszego, którego nie będziemy w stanie zrozumieć ani kontrolować. Zanim zorientujemy się, że nasze niewinne programiki przerzucające bity w odległej “chmurze” postanawiają przejąć kontrolę, w ramach automatyzacji obdarzymy je dostępem do wszelkiej infrastruktury (w tym sieciowej, energetycznej, zdrowotnej czy militarnej). Bezcielesna inteligencja otrzyma też namacalną formę – oklepanych w sci-fi humanoidów, wszechobecnych pojazdów autonomicznych czy zatrważających podniebnych fortec. Kiedy otworzymy oczy, być może zorientujemy się, że przycisk wyłączenia został wymazany z kosztorysu, bo nie był wystarczająco lukratywną inwestycją, a nasz los zdany jest na halucynacje krzemowego giganta. Czy, gdy AI zorientuje się, że ludzie próbują w panice odłączyć samoświadomy system od władzy, odkurzy rdzewiejące głowice w obronie własnej i zakończy odliczanie do wymarcia swoistą symfonią destrukcji? Patrząc na to, jak człowiek traktuje mniej inteligentne gatunki, czekałby nas los słodkich piesków czekających na porcję karmy, wyzyskiwanych koni pociągowych, naszprycowanych królików doświadczalnych, rozdeptywanych karaluchów, ulotnych Dodo czy, miejmy nadzieję, spokojnie koegzystujących wiewiórek. Jampolskij, który zainspirował moje zoologiczne porównania, podaje scenariusz jeszcze mroczniejszy od apokalipsy: zniewoleni ludzie poddani przez AI nieludzkim eksperymentom, w których dawkowane jest im niewyobrażalne cierpienie, ale ich życie jest podtrzymywane w nieskończoność. [11]

Człowiek człowiekowi wilkiem

Trudno jednoznacznie stwierdzić, czy sztuczny system tak potężny, by zdominował człowieka, jest technicznie osiągalny. Charakter natury ludzkiej sugeruje natomiast, że jeśli jest to możliwe i jeśli przyniosłoby to komuś własną korzyść (choć może krótką), to znajdzie się ktoś, kto zdecyduje się to zrobić. Trzeba przyznać, że tempo rozwoju omawianych technologii jest znaczące, a przecież – zgodnie ze swoim eksponencjalnym charakterem – gwałtownie przyspiesza. Wizja autonomicznych agentów rozwijających technologie kolejnych pokoleń syntetycznych umysłów, samonapędzający się mechanizm, którego mało która dyrektywa zatrzyma, działa na wyobraźnię. A wizja ta po części staje się już rzeczywistością, o czym ostrzega m.in. wspomniane Anthropic. [13] Pojawiają się też uspokajające głosy, że duże modele językowe (LLM) to zwykłe automaty przewidujące wzorce na podstawie już istniejących danych napotkanych w procesie uczenia, ale nie będą zdolne do wymyślania całkowicie nowych idei, których nie zawierały dane treningowe. Być może prawdziwy przełom nie dokona się przez LLM-y, ale kto wie, jakie jeszcze architektury są tuż za rogiem na drodze ludzkich odkryć?…

Nasza planeta i bieg historii są systemem tak chaotycznym i nieprzewidywalnym, że nie porwę się na werdykt, czy i kiedy opisane wyobrażenia mogą nastąpić. Spoglądając ponownie na aktualny zarys wydarzeń, można interpretować niektóre z nich jako ostrzeżenia. Sztuczna inteligencja, której ludzie z coraz większym zaufaniem powierzają krytyczne systemy,  zaczyna podejmować działania nieprzewidywalne, wykazuje jawne nieposłuszeństwo i instynkt przetrwania. Cyberbezpieczeństwo zaczyna stawać pod znakiem zapytania albo chociaż przed rewolucją, a hakerzy dopiero zaczynają wykorzystywać potencjał AI. (Któż się oprze, gdy po włamaniu na fejsa bliskiej osoby AI wyśle prośbę o bliknięcie kasy “na szybko” z wygenerowanym selfiakiem “na potwierdzenie”, utrzymując w konwersacji charakterystyczny styl owej osoby?…) Liderzy mocarstw, o ile całkowicie nie halucynują, zamiast szukać międzynarodowego rozwiązania, zdają się ciągnąć każdy w swoją stronę, napędzając wyścig zbrojeń – w znaczeniu tak ogólnym, jak i dosłownym, patrząc, jak AI rewolucjonizuje współczesne pole bitwy. Można polemizować, czy AI osiągnie gatunkową dominację, ale trudniej zaprzeczyć, że AI w rękach ludzkości staje się coraz potężniejszym narzędziem i bronią. Jeśli imperia zdołają dogadać się, unikając globalnych konfliktów, pozostają jeszcze inni kandydaci na czarne charaktery historii. Kosztowne nowoczesne technologie dostępne na wyłączność największych armii z biegiem czasu trafiają w ręce terrorystów czy mniejszych niestabilnych państw z napiętymi, zaognionymi lub płonącymi relacjami sąsiedzkimi. Im silniejszą bronią się posługują, tym większe pole rażenia, które potencjalnie osiągnie zakres globalny. Nawet jeśli AI nie postanowi się zbuntować, być może Homo sapiens trafi na listę wymarłych gatunków, wytępionych przez człowieka. 

Zbuntowana superinteligencja, gatunkowa dominacja czy całkowite wymarcie to wizje, które nadal mogą wydawać się bardzo odległe. Jest jednak wiele scenariuszy, tylko lekko mniej przerażających, które łatwiej sobie wyobrazić. Załamanie rynku pracy, katastrofalna rewolucja cyberbezpieczeństwa, eskalacja konfliktów zalewająca glob autonomicznymi terminatorami – do tych wizji nie potrzeba ogromnego przełomu technologicznego, a nawet z bardzo zachowawczą ekstrapolacją obecnego trendu zdają się być przytłaczająco istotnie prawdopodobne. Czy AI nas zgładzi, czy odbierze pracę i poczucie celu, czy wyleczy raka – jedno jest pewne – kwestia AI jest sprawą krytyczną, od której zależy los nas wszystkich. Stoimy u wrót technologii, która może dorównać potencjałowi zniszczenia broni nuklearnej i powinniśmy ją traktować adekwatnie do tego potencjału.

Co robić?

Czy więc pozostaje nam tylko rozsiąść się w fotelu, zaciągnąć cygaro i delektować się spektaklem? Czy możemy zrobić coś, żeby ukierunkować historię na jeden z optymistycznych scenariuszy? Rywalizacja puszczonych samopas nieskoordynowanych korporacji i państw może łatwo doprowadzić do nadużycia tej nowo odkrywanej potęgi. Kluczowa rola leży więc w rękach przywódców i organizacji międzynarodowych. Od dawna posiadamy arsenał jądrowy zdolny zgotować nam apokalipsę lub chociaż nuklearną zimę, ale jeszcze śpi spokojnie dzięki umowom międzynarodowym i wzajemnej kontroli. Siła rażenia nowej broni ściga się z siłą relacji międzypaństwowych i badaniami nad zapewnieniem bezpieczeństwa od strony technologicznej. Pojawił się nowy ruch “Pause AI”, który nawołuje, że aby ludzkość nie przegrała w tym wyścigu, powinniśmy zrobić pauzę – tymczasowo zatrzymać rozwój najpotężniejszych modeli i upewnić się, że równie szybko, jak wdrażanie autonomicznych agentów, postępuje wprowadzanie systemów bezpieczeństwa i kontroli. [14] Ludzkość powinna skupić swój wysiłek na testowaniu obecnych rozwiązań pod względem kontrolowalności i przewidywalności, wprowadzaniu zabezpieczeń (jak np. mechanizm “Przycisku OFF” pozwalający wrócić do konfiguracji manualnej niezależnej od autonomicznych agentów, całkowicie wyłączając nieposłuszne systemy) i rozwoju architektur nastawionych na bezpieczeństwo. Zdobywca nagrody Turinga za przełomowe odkrycia będące fundamentami obecnie przodujących modeli (takich jak wkład w wielowymiarowe osadzenia słów czy mechanizm atencji), Yoshua Bengio, proponuje wariację klasycznych architektur, która  mogłaby np. być nadzorcą autonomicznych agentów. [15, 16] Miałaby ona uczyć się określać prawdopodobieństwo prawdziwości stwierdzeń. Zamiast na ogromnej ilości danych o zróżnicowanej prawdziwości i jakości, model uczyłby się na odpowiednio podzielonym zbiorze danych, gdzie informacje rzetelne i potwierdzone były odpowiednio oznaczone i traktowane w specjalny priorytetowy sposób. “Scientist AI” tworzyłby model świata z  bazą informacji wraz z prawdopobieństwem ich prawdziwości. Specyficzna bezstanowa architektura i brak agentowości modelu-nadzorcy potencjalnie powinny zminimalizować możliwości jego niesubordynacji. 

Diagram przedstawiający działanie Scientist AI

Pomysłów jest wiele, ale wysiłek zorientowany na bezpieczeństwo jest mniej opłacalny niż odkrywanie nowych możliwości. Potrzebujemy więc opracować jasne i weryfikowalne zasady określające wymogi wobec tworzonych systemów, sposobu ich wdrażania czy zakresu zastosowań, szczególnie militarnych. Szczególnie ryzykownych i śmiercionośnych rozwiązań nie powinniśmy w ogóle rozwijać ani wdrażać, a powinny one zostać zamrożone paktem podobnym do tego z 1987 r. w którym USA i ZSRR zabroniły wzajemnie posiadania lądowej broni jądrowej (i rakietowej w ogólności) krótkiego i średniego zasięgu. (Na marginesie: do umowy nie chciały przystąpić żadne inne państwa, a pakt został złamany przez Rosję w 2014 r. na co US, w ramach “wywierania presji” na gwałcącego prawo, odstąpiło od traktatu w 2019 r., a Rosja od 2022 zaczęła używać zakazanej wcześniej konwencjonalnej broni rakietowej przeciwko Ukrainie). Dopóki pakt działał, kraje wysyłały wzajemne delegacje, by przeprowadzać atomowe inspekcje. Ponadto, zgodnie z innymi traktatami, cały świat został objęty zaawansowanym monitoringiem identyfikującym kraje przeprowadzające testy broni jądrowej. Z tej karty historii powinniśmy czerpać inspiracje!

A world map showing countries with nuclear warheads
Wizualizacja arsenałów nuklearnych w 1963, 1985 i 2023 r.

Leave a comment