{"id":9712,"date":"2026-06-14T13:42:48","date_gmt":"2026-06-14T13:42:48","guid":{"rendered":"https:\/\/architeles.eu\/ethics\/?p=9712"},"modified":"2026-06-15T18:50:19","modified_gmt":"2026-06-15T18:50:19","slug":"make-political-discourse-great-again-automatyczna-analiza-jezyka-polityki-od-sejmowych-stenogramow-po-media-spolecznosciowe","status":"publish","type":"post","link":"https:\/\/architeles.eu\/ethics\/index.php\/2026\/06\/14\/make-political-discourse-great-again-automatyczna-analiza-jezyka-polityki-od-sejmowych-stenogramow-po-media-spolecznosciowe\/","title":{"rendered":"\u201eMake Political Discourse Great Again\u201d \u2013 automatyczna analiza j\u0119zyka polityki: od sejmowych stenogram\u00f3w po media spo\u0142eczno\u015bciowe"},"content":{"rendered":"<p class=\"has-contrast-color has-luminescent-blush-background-color has-text-color has-background\">W dobie post\u0119puj\u0105cej cyfryzacji sfery publicznej, dyskurs polityczny ulega gwa\u0142townej, nap\u0119dzanej algorytmicznie transformacji. Od zinstytucjonalizowanych debat parlamentarnych po zdecentralizowane dyskusje w mediach spo\u0142eczno\u015bciowych \u2013 ka\u017cda wypowied\u017a staje si\u0119 punktem danych, podatnym na masow\u0105 analiz\u0119, klasyfikacj\u0119 i cenzur\u0119. Niniejszy artyku\u0142 podejmuje krytyczn\u0105 ewaluacj\u0119 wp\u0142ywu narz\u0119dzi Przetwarzania J\u0119zyka Naturalnego (NLP) i sztucznej inteligencji (AI) na kszta\u0142towanie si\u0119 komunikacji politycznej. Z jednej strony, innowacje Data Science, takie jak Korpus Dyskursu Parlamentarnego czy zaawansowane modele transformatorowe (np. HerBERT), oferuj\u0105 niespotykane dot\u0105d mo\u017cliwo\u015bci badawcze i transparentno\u015b\u0107 legislacyjn\u0105. Z drugiej jednak, zautomatyzowana moderacja tre\u015bci wprowadzana przez gigant\u00f3w technologicznych generuje zjawisko \u201eprywatyzacji cenzury\u201d, pot\u0119guj\u0105c polaryzacj\u0119 i zamykaj\u0105c obywateli w afektywnych ba\u0144kach filtruj\u0105cych. Aby za\u0142agodzi\u0107 ten technologiczno-spo\u0142eczny kryzys, konieczne jest wdro\u017cenie paradygmatu Wyja\u015bnialnej Sztucznej Inteligencji (Explainable AI \u2013 XAI), kt\u00f3ry przywr\u00f3ci transparentno\u015b\u0107 zautomatyzowanym decyzjom i obroni fundamentalne prawo do wolno\u015bci s\u0142owa w cyberprzestrzeni.<\/p>\n<h2>Algorytmizacja agory i narodziny cyfrowej polityki<\/h2>\n<p>Ewolucja komunikacji politycznej w XXI wieku doprowadzi\u0142a do bezprecedensowego przesuni\u0119cia punktu ci\u0119\u017cko\u015bci z tradycyjnych for\u00f3w debaty na platformy cyfrowe. Dyskurs, kt\u00f3ry niegdy\u015b formowa\u0142 si\u0119 w salach obrad i redakcjach gazet, zosta\u0142 przeniesiony do wirtualnej przestrzeni medi\u00f3w spo\u0142eczno\u015bciowych (Adamik-Szysiak, 2019). W tym nowym \u015brodowisku naturalnym j\u0119zyka polityki, ka\u017cda interakcja \u2013 polubienie, udost\u0119pnienie, czy komentarz \u2013 podlega dyktatowi zaawansowanych algorytm\u00f3w rekomendacyjnych. Systemy te, zaprojektowane pierwotnie w celach maksymalizacji zysk\u00f3w z reklam, sta\u0142y si\u0119 <em>de facto<\/em> niewidzialnymi redaktorami naczelnymi \u015bwiatowej debaty publicznej.<\/p>\n<p>Rozw\u00f3j sztucznej inteligencji, a w szczeg\u00f3lno\u015bci dziedziny Przetwarzania J\u0119zyka Naturalnego (Natural Language Processing \u2013 NLP), wyposa\u017cy\u0142 analityk\u00f3w, polityk\u00f3w i korporacje w narz\u0119dzia pozwalaj\u0105ce na zautomatyzowan\u0105 ekstrakcj\u0119 wiedzy z terabajt\u00f3w danych tekstowych. Procesy takie jak analiza wyd\u017awi\u0119ku emocjonalnego, detekcja mowy nienawi\u015bci, czy rozpoznawanie byt\u00f3w nazwanych (NER), zrewolucjonizowa\u0142y zdolno\u015b\u0107 do monitorowania nastroj\u00f3w spo\u0142ecznych w czasie rzeczywistym. Jednak pot\u0119ga tych instrument\u00f3w niesie za sob\u0105 fundamentalne dylematy etyczne. Modele AI wykorzystywane do moderacji i tzw. fact-checkingu wykazuj\u0105 ukryte uprzedzenia (<em>bias<\/em>), naruszaj\u0105c neutralno\u015b\u0107 debaty (R\u00f6ttger, 2025). W efekcie narasta poczucie alienacji obywateli wobec zautomatyzowanych system\u00f3w, a technologiczna obietnica racjonalizacji debaty ust\u0119puje miejsca skrajnej polaryzacji.<\/p>\n<h2>Teoretyczne ramy cyfrowego dyskursu<\/h2>\n<p>Zrozumienie mechanizm\u00f3w rz\u0105dz\u0105cych wsp\u00f3\u0142czesnym j\u0119zykiem polityki wymaga osadzenia zjawisk technologicznych w solidnych ramach socjologicznych i prawnych. Poni\u017cej przedstawiono analiz\u0119 najistotniejszych perspektyw teoretycznych, obejmuj\u0105cych degradacj\u0119 sfery publicznej, zjawisko baniek filtruj\u0105cych oraz zagro\u017cenia zwi\u0105zane z nowymi formami cenzury.<\/p>\n<h3>Nowy strukturalny rozw\u00f3j sfery publicznej wed\u0142ug Habermasa<\/h3>\n<p>Punktem wyj\u015bcia do analizy patologii w cyfrowej komunikacji politycznej jest klasyczna teoria sfery publicznej (niem. <em>\u00d6ffentlichkeit<\/em>), sformu\u0142owana przez niemieckiego filozofa J\u00fcrgena Habermasa w 1962 roku w dziele \u201eStrukturwandel der \u00d6ffentlichkeit\u201d. Habermas opisywa\u0142 historyczny proces kszta\u0142towania si\u0119 mieszcza\u0144skiej sfery publicznej, opartej na racjonalnej, r\u00f3wnej debacie, wolnej od przymusu pa\u0144stwowego. Sfera ta, funkcjonuj\u0105ca jako medium mi\u0119dzy pa\u0144stwem a spo\u0142ecze\u0144stwem obywatelskim, z czasem uleg\u0142a degeneracji na skutek komercjalizacji medi\u00f3w masowych.<\/p>\n<p>Pojawienie si\u0119 globalnej sieci internetowej pocz\u0105tkowo wzbudzi\u0142o nadzieje na rewitalizacj\u0119 partycypacyjnej demokracji. Jednak\u017ce, w swoim eseju \u201eEin neuer Strukturwandel der \u00d6ffentlichkeit und die deliberative Politik\u201d (2022), Habermas (Habermas, 2022) dokonuje krytycznej rewizji swoich dawnych nadziei. Autor wskazuje, \u017ce cyfryzacja doprowadzi\u0142a do radykalnej defragmentacji dyskursu publicznego. Zamiast uniwersalnego forum, otrzymali\u015bmy rozdrobnione \u201ep\u00f3\u0142-publiczno\u015bci\u201d (<em>semi-publics<\/em>), a logika komercyjnych platform spo\u0142eczno\u015bciowych systematycznie niszczy warunki niezb\u0119dne do racjonalnej, deliberatywnej polityki.<\/p>\n<p>W \u015bwiecie rz\u0105dzonym przez ekonomi\u0119 uwagi (<em>attention economy<\/em>), uwaga obywateli jest monetyzowana za pomoc\u0105 algorytm\u00f3w promuj\u0105cych tre\u015bci wzbudzaj\u0105ce najwi\u0119ksze zaanga\u017cowanie emocjonalne. Jak wskazuje Habermas, platformy cyfrowe zacieraj\u0105 granice mi\u0119dzy komunikacj\u0105 prywatn\u0105 a publiczn\u0105, przekszta\u0142caj\u0105c obywateli z powrotem w odizolowanych konsument\u00f3w informacji (Habermas, 2022).<\/p>\n<h3>Ba\u0144ki filtruj\u0105ce i afektywna polaryzacja w polskim Internecie<\/h3>\n<p>Bezpo\u015brednim nast\u0119pstwem opisanego wy\u017cej zjawiska defragmentacji jest narastaj\u0105ca radykalizacja postaw. W literaturze przedmiotu zjawisko to opisuje koncepcja \u201eba\u0144ki filtruj\u0105cej\u201d (<em>filter bubble<\/em>), spopularyzowana przez Eliego Parisera. Personalizacja tre\u015bci, b\u0119d\u0105ca fundamentem algorytm\u00f3w rekomendacyjnych, drastycznie zmniejsza prawdopodobie\u0144stwo zetkni\u0119cia si\u0119 u\u017cytkownika z pogl\u0105dami sprzecznymi z jego w\u0142asnymi. Prowadzi to do powstania hermetycznych ekosystem\u00f3w informacyjnych.<\/p>\n<p>W kontek\u015bcie polskim problem ten jest poddawany intensywnym badaniom. Analizy aktywno\u015bci na Twitterze (obecnie X) wykazuj\u0105, \u017ce o ile sama platforma nie wymusza drastycznych zmian w wewn\u0119trznych przekonaniach u\u017cytkownik\u00f3w, o tyle zmienia ona struktur\u0119 ich wzajemnych relacji i utrwala podzia\u0142y sieciowe (Parmelee &amp; Bichard, 2012).<\/p>\n<p>Najnowszy raport badawczy Fundacji Niezale\u017cne Media i Uniwersytetu SWPS (\u201eStan polaryzacji 2025\u201d), przeprowadzony na reprezentatywnej pr\u00f3bie 2351 os\u00f3b, dowodzi katastrofalnych skutk\u00f3w tego zjawiska. Z pe\u0142nym raportem mo\u017cna si\u0119 zapozna\u0107 w dokumencie <em>Stan polaryzacji 2025<\/em>. Pomiary obejmuj\u0105ce najwa\u017cniejsze kwestie spo\u0142eczno-polityczne wskazuj\u0105, \u017ce r\u00f3\u017cnice nap\u0119dzane przez media cyfrowe przyjmuj\u0105 wymiar g\u0142\u0119boko afektywny \u2013 oznaczaj\u0105cy autentyczn\u0105 wrogo\u015b\u0107 i alienacj\u0119 wobec os\u00f3b o odmiennych pogl\u0105dach. Cyfrowe \u015brodowisko informacyjne, projektowane z wykorzystaniem uczenia maszynowego (<em>machine learning<\/em>), automatyzuje zatem proces izolacji (Adamik-Szysiak, 2019).<\/p>\n<figure style=\"width: 800px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/spaces-cdn.owlstown.com\/blobs\/l3j578lacygmjyadmpglvnqa2emj\"><img decoding=\"async\" src=\"https:\/\/spaces-cdn.owlstown.com\/blobs\/l3j578lacygmjyadmpglvnqa2emj\" alt=\"Informatyka na dzi\u015b - Ba\u0144ka Informacyjna\" width=\"800\" height=\"503\" \/><\/a><figcaption class=\"wp-caption-text\">Proces zatapiania u\u017cytkownika w ba\u0144ce informacyjnej (\u017ar\u00f3d\u0142o: https:\/\/www.drmalinowski.edu.pl\/posts\/2635-banka-informacyjna)<\/figcaption><\/figure>\n<h3>Konstytucyjne prawo a \u201eprywatyzacja cenzury\u201d<\/h3>\n<p>Aspektem \u0142\u0105cz\u0105cym rozwa\u017cania socjologiczne z praktyk\u0105 Data Science jest problematyka wolno\u015bci wypowiedzi i cenzury. Konstytucja Rzeczypospolitej Polskiej, w artykule 54 ust\u0119p 2, stanowczo zakazuje cenzury prewencyjnej \u015brodk\u00f3w spo\u0142ecznego przekazu. Historycznie cenzura prewencyjna wymaga\u0142a przed\u0142o\u017cenia tekstu organom w\u0142adzy przed jego publikacj\u0105 (Kosiorowski, 2019).<\/p>\n<p>W dobie sztucznej inteligencji poj\u0119cie cenzury uleg\u0142o redefinicji. Zautomatyzowane systemy moderacji, dzia\u0142aj\u0105ce w oparciu o algorytmy NLP, potrafi\u0105 filtrowa\u0107 i blokowa\u0107 tre\u015bci w milisekundach. Zjawisko to badacze nazywaj\u0105 \u201eprywatyzacj\u0105 cenzury\u201d lub \u201ekomercjalizacj\u0105 propagandy\u201d. Niezawis\u0142e organy sprawiedliwo\u015bci ust\u0105pi\u0142y miejsca programistom, kt\u00f3rzy narzucaj\u0105 \u201ekodeksy spo\u0142eczno\u015bci\u201d egzekwowane bezwzgl\u0119dnie przez skrypty i sieci neuronowe. To rodzi dylemat etyczny: oprogramowanie staje si\u0119 ostatecznym prawem (<em>code is law<\/em>), <em>de facto<\/em> odbieraj\u0105c obywatelom prawo do jawnej i transparentnej deliberacji publicznej.<\/p>\n<h2>Stronniczo\u015b\u0107 modeli NLP i epistemologiczny bunt u\u017cytkownik\u00f3w<\/h2>\n<p>Zastosowanie system\u00f3w AI w polityce wykracza poza samo ukrywanie post\u00f3w. Obywatele masowo wykorzystuj\u0105 Wielkie Modele J\u0119zykowe (Large Language Models \u2013 LLMs), takie jak ChatGPT, Claude czy modele z rodziny LLaMA, do pozyskiwania informacji, tworzenia podsumowa\u0144 i oceniania wypowiedzi polityk\u00f3w. W obiegowej opinii maszyny uchodz\u0105 za bezstronne matematyczne konstrukty, lecz badania naukowe dowodz\u0105, \u017ce w rzeczywisto\u015bci s\u0105 g\u0142\u0119boko obarczone ukrytymi warto\u015bciowaniami.<\/p>\n<h3>Skrzywienie ideologiczne (Political Bias) w LLM<\/h3>\n<p>Ewaluacja uprzedze\u0144 modeli jest wyzwaniem naukowym. Badania przeprowadzone przez A. Halla, S. Westwooda i J. Grimera z Uniwersytetu Stanforda, przy u\u017cyciu metodyki \u201eodpowiedzi o trafno\u015bci ekologicznej\u201d (<em>ecologically validated responses<\/em>), dowodz\u0105 ponad wszelk\u0105 w\u0105tpliwo\u015b\u0107, \u017ce najpopularniejsze modele wykazuj\u0105 zauwa\u017calne skrzywienie w stron\u0119 postaw lewicowych (<em>left-leaning slant<\/em>) (Hall et al., 2025). In\u017cynierowie mog\u0105 \u2013 dzi\u0119ki odpowiednim modyfikacjom na etapie promptowania \u2013 sprowadzi\u0107 modele do pozycji bardziej neutralnych, jednak domy\u015blne wagi modeli faworyzuj\u0105 okre\u015blon\u0105 wizj\u0119 \u015bwiata.<\/p>\n<p>Podobne wnioski p\u0142yn\u0105 z bada\u0144 nad modelem IssueBench prowadzonych przez zesp\u00f3\u0142 Paula R\u00f6ttgera (R\u00f6ttger, 2025). Wyniki wskazuj\u0105 na siln\u0105 zbie\u017cno\u015b\u0107 odpowiedzi AI ze stanowiskami Demokrat\u00f3w w USA w kluczowych politykach spo\u0142ecznych. Niezwykle interesuj\u0105ce s\u0105 eksperymenty analizuj\u0105ce \u201edynamik\u0119 opinii\u201d (<em>opinion dynamics<\/em>) podczas symulowanych debat pomi\u0119dzy autonomicznymi agentami LLM (Chuang et al., 2024). Udowodniono, \u017ce agenci zaprogramowani jako \u201ekonserwaty\u015bci\u201d, w toku algorytmicznej dyskusji maj\u0105 tendencj\u0119 do przesuwania swoich argument\u00f3w w kierunku centrum, podczas gdy agenci \u201eliberalni\u201d oraz neutralni zachowuj\u0105 sta\u0142o\u015b\u0107 postaw.<\/p>\n<p>Wynika to w du\u017cej mierze z tzw. uprzedzenia dotycz\u0105cego bezpiecze\u0144stwa (<em>safety bias<\/em>) nak\u0142adanego na modele podczas treningu (RLHF \u2013 <em>Reinforcement Learning from Human Feedback<\/em>), co wymusza unikanie narracji uznawanych w korporacjach technologicznych za niebezpieczne, a tym samym kszta\u0142tuje okre\u015blony polityczny konsensus algorytmiczny.<\/p>\n<figure id=\"attachment_9723\" aria-describedby=\"caption-attachment-9723\" style=\"width: 552px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" class=\"size-full wp-image-9723\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/image.png\" alt=\"\" width=\"552\" height=\"320\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/image.png 552w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/image-300x174.png 300w\" sizes=\"(max-width: 552px) 100vw, 552px\" \/><figcaption id=\"caption-attachment-9723\" class=\"wp-caption-text\">Kompas polityczny modeli j\u0119zykowych (\u017ar\u00f3d\u0142o: https:\/\/trackingai.org\/political-test)<\/figcaption><\/figure>\n<h2>Narz\u0119dzia Data Science do obiektywizacji j\u0119zyka polityki w Polsce<\/h2>\n<p>Pomimo mrocznego obrazu korporacyjnej moderacji, technologie Data Science posiadaj\u0105 niezwyk\u0142y potencja\u0142 emancypacyjny. Otwarty kod \u017ar\u00f3d\u0142owy (<em>open-source<\/em>) oraz publiczne inicjatywy badawcze stanowi\u0105 fundament dla obywatelskiego audytu sfery politycznej. Polska dysponuje na tym polu jednym z najbardziej zaawansowanych na \u015bwiecie \u015brodowisk lingwistycznych, umo\u017cliwiaj\u0105cych matematyczn\u0105 precyzj\u0119 w badaniu ewolucji j\u0119zyka polityki.<\/p>\n<h3>Korpus Dyskursu Parlamentarnego (KDP)<\/h3>\n<p>Osi\u0105gni\u0119ciem o fundamentalnym znaczeniu dla polskiej humanistyki cyfrowej jest powstanie Korpusu Dyskursu Parlamentarnego (KDP), realizowanego w ramach europejskiego konsorcjum badawczego CLARIN-PL, pod kierownictwem Macieja Ogrodniczuka (Ogrodniczuk, 2018). KDP to monumentalny zbi\u00f3r zdygitalizowanych i ustrukturyzowanych tekst\u00f3w, zawieraj\u0105cy pe\u0142ne stenogramy obrad polskiego parlamentu od 1919 roku do dnia dzisiejszego.<\/p>\n<p>Korpus ten, integruj\u0105cy dane historyczne (II RP, PRL) z bie\u017c\u0105cymi pracami Sejmu i Senatu III RP, zawiera obecnie ponad 43 miliony w pe\u0142ni zanalizowanych token\u00f3w (s\u0142\u00f3w i znak\u00f3w interpunkcyjnych). Dane pozyskiwane dzi\u0119ki uprzejmo\u015bci Kancelarii Sejmu i Senatu dost\u0119pne s\u0105 w domenie publicznej, co pozwala na transparentne badania. Przetwarzanie i lematyzacja tekst\u00f3w, nierzadko historycznych i zawieraj\u0105cych archaizmy oraz b\u0142\u0119dy OCR, opiera si\u0119 na kaskadzie specjalistycznych program\u00f3w.<\/p>\n<p>W poni\u017cszej tabeli zestawiono kluczowe modu\u0142y analityczne nap\u0119dzaj\u0105ce architektur\u0119 KDP, opracowane przez polskich badaczy:<\/p>\n<figure class=\"wp-block-table is-style-stripes\">\n<table>\n<thead>\n<tr>\n<th>Nazwa Modu\u0142u<\/th>\n<th>Funkcja i Zastosowanie w Przetwarzaniu Dyskursu<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>Morfeusz SGJP<\/strong><\/td>\n<td>Odpowiada za segmentacj\u0119 tekstu (<em>utterance-level<\/em>), tokenizacj\u0119 oraz lematyzacj\u0119 form morfologicznych polszczyzny.<\/td>\n<\/tr>\n<tr>\n<td><strong>Pantera<\/strong><\/td>\n<td>Modu\u0142 odpowiedzialny za dezambiguacj\u0119 (jednoznaczne rozstrzyganie) skomplikowanych opis\u00f3w morfosyntaktycznych.<\/td>\n<\/tr>\n<tr>\n<td><strong>Spejd<\/strong><\/td>\n<td>Parser przeprowadzaj\u0105cy analiz\u0119 sk\u0142adniow\u0105 \u2013 wykrywa syntaktyczne grupy s\u0142\u00f3w w zdaniach pos\u0142\u00f3w.<\/td>\n<\/tr>\n<tr>\n<td><strong>Nerf<\/strong><\/td>\n<td>Implementacja modelu rozpoznawania byt\u00f3w nazwanych (Named Entity Recognition). Pozwala wykrywa\u0107 odniesienia do os\u00f3b, organizacji i lokacji.<\/td>\n<\/tr>\n<tr>\n<td><strong>Smyrna \/ Poliqarp<\/strong><\/td>\n<td>Z\u0142o\u017cone silniki wyszukiwawcze pozwalaj\u0105ce na tworzenie zapyta\u0144 lingwistycznych i statystycznych (np. zestawie\u0144 n-gram\u00f3w w wypowiedziach partii).<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/figure>\n<figure id=\"attachment_9722\" aria-describedby=\"caption-attachment-9722\" style=\"width: 644px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" class=\"size-full wp-image-9722\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/3785_07_01.png\" alt=\"\" width=\"644\" height=\"485\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/3785_07_01.png 644w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2026\/06\/3785_07_01-300x226.png 300w\" sizes=\"(max-width: 644px) 100vw, 644px\" \/><figcaption id=\"caption-attachment-9722\" class=\"wp-caption-text\">Drzewo sk\u0142adniowe (\u017ar\u00f3d\u0142o: https:\/\/subscription.packtpub.com\/book\/data\/9781784391799\/7\/ch07lvl1sec44\/understanding-parse-trees)<\/figcaption><\/figure>\n<p>Dzi\u0119ki tak zbudowanej infrastrukturze (reprezentowanej w formacie TEI P5), dziennikarz \u015bledczy lub politolog mo\u017ce w kilka sekund przeanalizowa\u0107, w jaki spos\u00f3b zmienia\u0142a si\u0119 retoryka i nastawienie do poszczeg\u00f3lnych temat\u00f3w w wypowiedziach partii na przestrzeni ostatnich dekad (Ogrodniczuk, 2018). Stanowi to pot\u0119\u017cne, organizacyjne ramy dla obywatelskiego fact-checkingu opartego na historycznych danych empirycznych.<\/p>\n<h3>Obywatelskie zastosowania danych masowych<\/h3>\n<p>Technologiczne zasoby znajduj\u0105 odzwierciedlenie w organizacjach typu watchdog. Inicjatywy takie jak \u201eSejmometr.pl\u201d czy dzia\u0142aj\u0105cy pod egid\u0105 Stowarzyszenia 61 portal \u201eMamPrawoWiedziec.pl\u201d, masowo pobieraj\u0105 i wizualizuj\u0105 dane otwartego rz\u0105du (Open Government Data). Zgromadzenie blisko 5TB informacji, obejmuj\u0105cych akty prawne, wyniki g\u0142osowa\u0144 w jednostkach samorz\u0105du terytorialnego i o\u015bwiadczenia maj\u0105tkowe, pozwala na \u015bledzenie w czasie rzeczywistym powi\u0105za\u0144 kapita\u0142owych i afiliacji politycznych. Systemy te nie ingeruj\u0105 w tre\u015b\u0107 (jak systemy cenzuruj\u0105ce), lecz eksponuj\u0105 ukryte wzorce polityczne dla dobra og\u00f3\u0142u.<\/p>\n<h3>Zaawansowane modele analizy wyd\u017awi\u0119ku emocjonalnego: od HerBERTa do RoBERTa-8k<\/h3>\n<p>Cho\u0107 klasyczne modu\u0142y analizy lingwistycznej znakomicie sprawdzaj\u0105 si\u0119 na poprawnej polszczy\u017anie z m\u00f3wnicy sejmowej, zawodz\u0105 w konfrontacji z potocznym, zniekszta\u0142conym afektywnie j\u0119zykiem Twittera (X) czy komentarzy pod postami. Rozwi\u0105zaniem okaza\u0142y si\u0119 G\u0142\u0119bokie Modele J\u0119zykowe oparte na architekturze Transformer\u00f3w.<\/p>\n<p>Prze\u0142omem dla analizy j\u0119zyka polskiego by\u0142o stworzenie modelu HerBERT, zaproponowanego przez zesp\u00f3\u0142 pod kierunkiem P. Rybaka (Rybak et al., 2020). Model ten (oparty na architekturze BERT), wytrenowany na polskoj\u0119zycznych korpusach przy u\u017cyciu funkcji celu MLM (Masked Language Modeling), pozwoli\u0142 na g\u0142\u0119bokie zrozumienie semantyczne polskiego s\u0142ownictwa. Skuteczno\u015b\u0107 modeli mierzona jest dzi\u0119ki zestawowi benchmark\u00f3w KLEJ, uwzgl\u0119dniaj\u0105cemu np. analiz\u0119 wyd\u017awi\u0119ku emocjonalnego.<\/p>\n<p>Spo\u0142eczno\u015b\u0107 platformy Hugging Face szybko udost\u0119pni\u0142a wyspecjalizowane warianty HerBERTa, takie jak model <code>bardsai\/twitter-sentiment-pl-base<\/code>, kt\u00f3ry poddano procesowi douczania (<em>fine-tuning<\/em>) na polskoj\u0119zycznych odpowiednikach zbior\u00f3w typu TweetEval. Model ten potrafi z chirurgiczn\u0105 precyzj\u0105 przyporz\u0105dkowywa\u0107 wpisy do klas: pozytywny, negatywny i neutralny. W zastosowaniach finansowo-rynkowych u\u017cywa si\u0119 pochodnych modelu trenowanych na s\u0142owniku Financial PhraseBank (<code>bardsai\/finance-sentiment-pl-base<\/code>).<\/p>\n<p>Z kolei dla potrzeb podsumowywania ekstremalnie d\u0142ugich dokument\u00f3w politycznych, np. wielostronicowych projekt\u00f3w ustaw lub ca\u0142ych debat, in\u017cynierowie z PKO BP udost\u0119pnili model polish-roberta-8k. Model ten, poprzez modyfikacj\u0119 osadze\u0144 pozycyjnych (positional embedding) i trening z mechanizmem Flash Attention 2, potrafi przyj\u0105\u0107 kontekst do 8192 token\u00f3w, zachowuj\u0105c parametry wy\u017cszego rz\u0119du ni\u017c komercyjne LLM. Daje to nieograniczone niemal mo\u017cliwo\u015bci tworzenia automatycznych kompendi\u00f3w prawa.<\/p>\n<p>Poni\u017csza tabela por\u00f3wnuje wsp\u00f3\u0142czesne narz\u0119dzia wykorzystywane do analizy polskiego dyskursu politycznego:<\/p>\n<figure class=\"wp-block-table is-style-stripes\">\n<table>\n<thead>\n<tr>\n<th>Model \/ Technologia<\/th>\n<th>Podstawa Architektury<\/th>\n<th>G\u0142\u00f3wne Przeznaczenie w Badaniach Politycznych<\/th>\n<th>Kontekst \/ Okno Token\u00f3w<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>Morfeusz SGJP (KDP)<\/strong><\/td>\n<td>Algorytmy regu\u0142owe \/ S\u0142owniki<\/td>\n<td>Tagowanie gramatyczne stenogram\u00f3w historycznych, lematyzacja.<\/td>\n<td>Zdanie \/ Wypowied\u017a<\/td>\n<\/tr>\n<tr>\n<td><strong>HerBERT (bardsai)<\/strong><\/td>\n<td>Transformer (BERT) \/ MLM<\/td>\n<td>B\u0142yskawiczna analiza wyd\u017awi\u0119ku emocjonalnego i detekcja hejtu na X.<\/td>\n<td>512 token\u00f3w<\/td>\n<\/tr>\n<tr>\n<td><strong>RoBERTa-8k (Polish)<\/strong><\/td>\n<td>Transformer (RoBERTa)<\/td>\n<td>Klasyfikacja wielostronicowych ustaw i pe\u0142nych sprawozda\u0144 z komisji.<\/td>\n<td>8192 token\u00f3w<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/figure>\n<h2>Dlaczego kolejne, lepsze generacje modeli AI nie ulecz\u0105 naszej demokracji?<\/h2>\n<p>Zderzenie akademickich teorii socjologicznych Habermasa z twardymi osi\u0105gni\u0119ciami polskiego in\u017cynierstwa Data Science (KDP, HerBERT) oraz z praktykami cenzorskimi platform spo\u0142eczno\u015bciowych (Big Tech) ukazuje fundamentalny, nierozwi\u0105zany dot\u0105d konflikt w nowoczesnych pa\u0144stwach demokratycznych.<\/p>\n<p>G\u0142\u00f3wnym paradygmatem korporacji Doliny Krzemowej jest twierdzenie, \u017ce ich modele AI do moderacji politycznej zachowuj\u0105 neutralno\u015b\u0107 \u015bwiatopogl\u0105dow\u0105. Opieraj\u0105c si\u0119 na przeanalizowanych tekstach \u017ar\u00f3d\u0142owych oraz badaniach ze Stanfordu (Hall et al., 2025), zdecydowanie odrzucamy to stanowisko. Model uczenia maszynowego nie dzia\u0142a w aksjologicznej pr\u00f3\u017cni. Skrzywienia modelu wynikaj\u0105 z faktu, \u017ce tzw. uczenie nadzorowane i nagradzanie modeli ludzk\u0105 informacj\u0105 zwrotn\u0105 (RLHF) przeprowadzane jest przez osoby o zdefiniowanych preferencjach (przewa\u017cnie liberalnych \u015brodowisk technologicznych), co wymusza na maszynach tzw. \u201ekonsensus wyr\u00f3wnuj\u0105cy\u201d (equity-consensus bias). Jak ujawni\u0142y badania nad dynamik\u0105 wirtualnych debat modeli, konserwatywne modele ust\u0119puj\u0105 przed lewicowymi, poniewa\u017c \u201epostawa neutralna\u201d w uj\u0119ciu deweloper\u00f3w le\u017cy bli\u017cej lewej strony spektrum politycznego.<\/p>\n<p>Por\u00f3wnuj\u0105c infrastruktur\u0119 polskiego \u015brodowiska akademickiego z architektur\u0105 algorytm\u00f3w na Twitterze czy Facebooku, uderza ca\u0142kowicie odmienna filozofia transparentno\u015bci. Tw\u00f3rcy Korpusu Dyskursu Parlamentarnego zbudowali swoj\u0105 aplikacj\u0119 na fundamentach otwartej nauki. Ka\u017cdy tag nadany s\u0142owu mo\u017ce by\u0107 zweryfikowany; ka\u017cdy skrypt udost\u0119pniony jest badaczowi do wgl\u0105du (Ogrodniczuk, 2018). Obywatelskie portale jak Sejmometr nie oceniaj\u0105 polityka, ale dostarczaj\u0105 obywatelowi zestaw surowych danych statystycznych. Tymczasem sieci spo\u0142eczno\u015bciowe stosuj\u0105 prywatne modele typu \u201eblack-box\u201d. Nie wiemy, jakie wagi decyzyjne stoj\u0105 za redukcj\u0105 zasi\u0119g\u00f3w (shadowban). Oznacza to urzeczywistnienie najgorszych koszmar\u00f3w klasycznej teorii sfery publicznej (Habermas, 2022): sprywatyzowanie miejsca publicznej deliberacji, w kt\u00f3rym niewyja\u015bnialne algorytmy steruj\u0105 przep\u0142ywem opinii, podbijaj\u0105c afektywn\u0105 polaryzacj\u0119 zdiagnozowan\u0105 w badaniach \u015brodowiska Uniwersytetu SWPS. Zautomatyzowana prewencyjna moderacja bez podania matematycznej przyczyny narusza liter\u0119 wolno\u015bci wypowiedzi konstytucyjnej (Kosiorowski, 2019).<\/p>\n<p>Uwa\u017camy zatem, \u017ce techno-optymizm zak\u0142adaj\u0105cy, i\u017c udoskonalenie modeli j\u0119zykowych samoistnie usunie z debaty publicznej hejt i fa\u0142sz, jest za\u0142o\u017ceniem zbyt idealistycznym. Implementacja bardziej &#8222;zaawansowanych&#8221; modeli fact-checkingowych nie przywr\u00f3ci zaufania publicznego, poniewa\u017c obywatele intuicyjnie (i s\u0142usznie) buntuj\u0105 si\u0119 przeciwko arbitralnemu s\u0119dziowaniu maszyn. Rozwi\u0105zaniem polaryzacji nie jest delegowanie os\u0105du spo\u0142ecznego nowej iteracji LLM-a, lecz wprowadzenie odpowiednich ram prawnych, kt\u00f3re zapewni\u0105 transparentno\u015b\u0107 dzia\u0142ania algorytm\u00f3w.<\/p>\n<h2>Zastosowanie koncepcji Explainable AI (XAI) do audytu modeli NLP<\/h2>\n<p>Odpowiedzi\u0105 na wyartyku\u0142owany kryzys braku zaufania do cenzuruj\u0105cych algorytm\u00f3w oraz poczucia politycznej alienacji jest systemowe wdro\u017cenie technik Wyja\u015bnialnej Sztucznej Inteligencji (Explainable AI &#8211; XAI). Badania interakcji cz\u0142owieka z komputerem dowodz\u0105 empirycznie, \u017ce gdy u\u017cytkownikowi prezentowany jest obok wyniku etykieta ze wska\u017anikami wyja\u015bniaj\u0105cymi logik\u0119 predykcji, zjawisko odrzucenia i polaryzacji znacznie maleje.<\/p>\n<p>W domenie przetwarzania j\u0119zyka naturalnego kr\u00f3luj\u0105 metody takie jak LIME (Local Interpretable Model-Agnostic Explanations) i SHAP (SHapley Additive exPlanations). Metoda SHAP to wyrafinowana technika matematyczna oparta na kooperacyjnej teorii gier Shapleya. Pozwala ona wyliczy\u0107 wk\u0142ad (warto\u015b\u0107 Shapleya) ka\u017cdej pojedynczej cechy (np. okre\u015blonego tokena, wyrazu w dokumencie) w ostateczny wynik analizy sieci neuronowej.<\/p>\n<p>Jako praktyczne rozwi\u0105zanie informatyczne, niweluj\u0105ce problem \u201eczarnej skrzynki\u201d dla polskiego obywatela korzystaj\u0105cego z portalu fact-checkingowego, proponujemy zintegrowanie metody SHAP z analizatorem HerBERT. Poni\u017cej zamieszczono demonstracyjny fragment kodu w j\u0119zyku Python, s\u0142u\u017c\u0105cy do oceny wypowiedzi polityk\u00f3w.<\/p>\n<pre class=\"wp-block-code\"><code>import torch\r\nimport transformers\r\nimport shap\r\nimport scipy as sp\r\nimport numpy as np\r\n\r\n# 1. Za\u0142adowanie polskiego modelu do analizy wyd\u017awi\u0119ku emocjonalnego\r\nMODEL_NAME = \"bardsai\/twitter-sentiment-pl-base\"\r\ntokenizer = transformers.AutoTokenizer.from_pretrained(MODEL_NAME)\r\nmodel = transformers.AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)\r\n\r\n# 2. Definicja pipeline'u\r\nnlp_pipeline = transformers.pipeline(\r\n    \"sentiment-analysis\", \r\n    model=model, \r\n    tokenizer=tokenizer, \r\n    return_all_scores=True \r\n)\r\n\r\n# 3. Funkcja f mapuj\u0105ca tekst na prawdopodobie\u0144stwa (wymagana przez SHAP)\r\ndef f(x):\r\n    # Tokenizacja wej\u015bcia tekstowego i konwersja na tensory PyTorch\r\n    inputs = tokenizer(x.tolist(), return_tensors=\"pt\", padding=True, truncation=True)\r\n    with torch.no_grad():\r\n        outputs = model(**inputs).logits\r\n    # Konwersja logit\u00f3w na prawdopodobie\u0144stwa klas (0-1)\r\n    scores = torch.nn.functional.softmax(outputs, dim=-1).cpu().numpy()\r\n    return scores\r\n\r\n# 4. Inicjalizacja wyja\u015bniacza SHAP dla modeli tekstowych\r\nexplainer = shap.Explainer(f, tokenizer)\r\n\r\n# 5. Tekst do analizy\r\npolityczny_tweet = (\r\n    \"Ustawa forsowana przez opozycj\u0119 to ca\u0142kowity absurd i zniszczy nasz\u0105 gospodark\u0119! \"\r\n    \"Jedynie jeden punkt dotycz\u0105cy dofinansowa\u0144 okaza\u0142 si\u0119 umiarkowanie dobry.\"\r\n)\r\n\r\n# 6. Obliczenie warto\u015bci Shapleya (atrybucja cech)\r\nshap_values = explainer([polityczny_tweet])\r\n\r\n# 7. Wy\u015bwietlenie interaktywnej wizualizacji wp\u0142ywu s\u0142\u00f3w\r\nshap.plots.text(shap_values)<\/code><\/pre>\n<p>Wdro\u017cenie powy\u017cszej architektury nie tylko demaskuje uprzedzenia ukryte w modelach j\u0119zykowych, ale tak\u017ce wyhamowuje efekt mro\u017c\u0105cy (chilling effect) w spo\u0142ecze\u0144stwie. Obywatel, zamiast binarnej inwigilacji, otrzymuje pe\u0142noprawny, demokratyczny wgl\u0105d w regu\u0142y decyzyjne algorytmu. Tym samym technologia staje si\u0119 z powrotem s\u0142u\u017cebna wzgl\u0119dem debaty, a narz\u0119dzia Data Science zaczynaj\u0105 funkcjonowa\u0107 jak szk\u0142o powi\u0119kszaj\u0105ce dla sfery publicznej, chroni\u0105ce zarazem konstytucyjne warto\u015bci o wolno\u015bci s\u0142owa i przekazu.<\/p>\n<h2>Konkluzja<\/h2>\n<p>Algorytmizacja dyskursu politycznego sta\u0142a si\u0119 w trzeciej dekadzie XXI wieku nieodwracalnym faktem. Analiza wp\u0142ywu nowoczesnych narz\u0119dzi Data Science na sfer\u0119 publiczn\u0105 i etyk\u0119 u\u015bwiadamia dualn\u0105 natur\u0119 sztucznej inteligencji. Jak dowodz\u0105 koncepcje filozoficzne, infrastruktury pot\u0119\u017cnych podmiot\u00f3w technologicznych monetyzuj\u0105 uwag\u0119 spo\u0142ecze\u0144stw i eskaluj\u0105 polaryzacj\u0119, daj\u0105c u\u0142ud\u0119 wolno\u015bci podczas stosowania prewencyjnej cyfrowej cenzury. Modele oceniaj\u0105ce tre\u015bci potrafi\u0105 same wykazywa\u0107 skrzywienia ideologiczne, a ich zamkni\u0119ty w \u201eczarnej skrzynce\u201d charakter budzi zrozumia\u0142y op\u00f3r obywateli broni\u0105cych wolno\u015bci opinii.<\/p>\n<p>Mimo to, otwarte rozwi\u0105zania technologiczne budowane m.in. przez polskie instytucje udowadniaj\u0105, \u017ce technologia mo\u017ce sprzyja\u0107 transparentno\u015bci. Monstrualny zbi\u00f3r wiedzy, jakim jest Korpus Dyskursu Parlamentarnego, uzbrojony we flagowe zdobycze dziedziny przetwarzania j\u0119zyka polskiego, takie jak struktury HerBERTa i modele zdolne przetwarza\u0107 gigantyczne dokumenty urz\u0119dowe, stanowi unikalne narz\u0119dzie badawcze do obiektywizacji faktograficznej i ochrony racjonalnego j\u0119zyka pa\u0144stwowego.<\/p>\n<p>Z\u0142otym \u015brodkiem prowadz\u0105cym do idei \u201eMake Political Discourse Great Again\u201d jest wymuszenie legislacyjnego maria\u017cu modeli analitycznych z systemami Wyja\u015bnialnej Sztucznej Inteligencji, takimi jak biblioteki SHAP i LIME. Pozwoli to wyrwa\u0107 w\u0142adz\u0119 dyskrecjonalnej moderacji z r\u0105k niewidzialnych korporacyjnych weryfikator\u00f3w, przekazuj\u0105c narz\u0119dzia do zrozumienia \u015bwiata z powrotem w r\u0119ce samych obywateli, dla kt\u00f3rych i przez kt\u00f3rych polityka zosta\u0142a stworzona.<\/p>\n<h2>Literatura<\/h2>\n<ul>\n<li>Habermas, J. (2022). <em>Ein neuer Strukturwandel der \u00d6ffentlichkeit und die deliberative Politik<\/em>. Suhrkamp Verlag.<\/li>\n<li>Hall, A., Westwood, S., &amp; Grimmer, J. (2025). <em>Measuring Perceived Slant in Large Language Models Through User Evaluations<\/em>. Stanford Graduate School of Business Research Papers, 1-30.<\/li>\n<li>Kosiorowski, Z. (2019). <em>Piractwo internetowe a wolno\u015b\u0107 s\u0142owa i dost\u0119pu do tre\u015bci w internecie<\/em>. Media Management, 7(1), 29-44.<\/li>\n<li>Ogrodniczuk, M. (2018). <em>Polish Parliamentary Corpus<\/em>. Proceedings of the LREC 2018 Workshop ParlaCLARIN, 15\u201319.<\/li>\n<li>Rybak, P., Mroczkowski, R., Tracz, J., &amp; Gawlik, I. (2020). <em>KLEJ: Comprehensive Benchmark for Polish Language Understanding<\/em>. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 1191\u20131201.<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>W dobie post\u0119puj\u0105cej cyfryzacji sfery publicznej, dyskurs polityczny ulega gwa\u0142townej, nap\u0119dzanej algorytmicznie transformacji. Od zinstytucjonalizowanych debat parlamentarnych po zdecentralizowane dyskusje w mediach spo\u0142eczno\u015bciowych \u2013 ka\u017cda wypowied\u017a staje si\u0119 punktem danych, podatnym na masow\u0105 analiz\u0119, klasyfikacj\u0119 i cenzur\u0119. Niniejszy artyku\u0142 podejmuje krytyczn\u0105 ewaluacj\u0119 wp\u0142ywu narz\u0119dzi Przetwarzania J\u0119zyka Naturalnego (NLP) i sztucznej inteligencji (AI) na kszta\u0142towanie si\u0119 [&hellip;]<\/p>\n","protected":false},"author":364,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[597],"tags":[610,609,563,339,15,50,43,279,256,213],"class_list":["post-9712","post","type-post","status-publish","format-standard","hentry","category-agh-2025-26","tag-bankainformacyjna","tag-polaryzacja","tag-polityka","tag-sztucznainteligencja","tag-ai","tag-cenzura","tag-data-science","tag-llm","tag-nlp","tag-xai"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/9712","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/users\/364"}],"replies":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/comments?post=9712"}],"version-history":[{"count":10,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/9712\/revisions"}],"predecessor-version":[{"id":9730,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/9712\/revisions\/9730"}],"wp:attachment":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/media?parent=9712"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/categories?post=9712"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/tags?post=9712"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}