Home » AGH 2025/26 » „Make Political Discourse Great Again” – automatyczna analiza języka polityki: od sejmowych stenogramów po media społecznościowe

„Make Political Discourse Great Again” – automatyczna analiza języka polityki: od sejmowych stenogramów po media społecznościowe

By Witold Strzeboński and Mateusz Waga in AGH 2025/26 on 14 czerwca, 2026

Spread the love

W dobie postępującej cyfryzacji sfery publicznej, dyskurs polityczny ulega gwałtownej, napędzanej algorytmicznie transformacji. Od zinstytucjonalizowanych debat parlamentarnych po zdecentralizowane dyskusje w mediach społecznościowych – każda wypowiedź staje się punktem danych, podatnym na masową analizę, klasyfikację i cenzurę. Niniejszy artykuł podejmuje krytyczną ewaluację wpływu narzędzi Przetwarzania Języka Naturalnego (NLP) i sztucznej inteligencji (AI) na kształtowanie się komunikacji politycznej. Z jednej strony, innowacje Data Science, takie jak Korpus Dyskursu Parlamentarnego czy zaawansowane modele transformatorowe (np. HerBERT), oferują niespotykane dotąd możliwości badawcze i transparentność legislacyjną. Z drugiej jednak, zautomatyzowana moderacja treści wprowadzana przez gigantów technologicznych generuje zjawisko „prywatyzacji cenzury”, potęgując polaryzację i zamykając obywateli w afektywnych bańkach filtrujących. Aby załagodzić ten technologiczno-społeczny kryzys, konieczne jest wdrożenie paradygmatu Wyjaśnialnej Sztucznej Inteligencji (Explainable AI – XAI), który przywróci transparentność zautomatyzowanym decyzjom i obroni fundamentalne prawo do wolności słowa w cyberprzestrzeni.

Algorytmizacja agory i narodziny cyfrowej polityki

Ewolucja komunikacji politycznej w XXI wieku doprowadziła do bezprecedensowego przesunięcia punktu ciężkości z tradycyjnych forów debaty na platformy cyfrowe. Dyskurs, który niegdyś formował się w salach obrad i redakcjach gazet, został przeniesiony do wirtualnej przestrzeni mediów społecznościowych (Adamik-Szysiak, 2019). W tym nowym środowisku naturalnym języka polityki, każda interakcja – polubienie, udostępnienie, czy komentarz – podlega dyktatowi zaawansowanych algorytmów rekomendacyjnych. Systemy te, zaprojektowane pierwotnie w celach maksymalizacji zysków z reklam, stały się de facto niewidzialnymi redaktorami naczelnymi światowej debaty publicznej.

Rozwój sztucznej inteligencji, a w szczególności dziedziny Przetwarzania Języka Naturalnego (Natural Language Processing – NLP), wyposażył analityków, polityków i korporacje w narzędzia pozwalające na zautomatyzowaną ekstrakcję wiedzy z terabajtów danych tekstowych. Procesy takie jak analiza wydźwięku emocjonalnego, detekcja mowy nienawiści, czy rozpoznawanie bytów nazwanych (NER), zrewolucjonizowały zdolność do monitorowania nastrojów społecznych w czasie rzeczywistym. Jednak potęga tych instrumentów niesie za sobą fundamentalne dylematy etyczne. Modele AI wykorzystywane do moderacji i tzw. fact-checkingu wykazują ukryte uprzedzenia (bias), naruszając neutralność debaty (Röttger, 2025). W efekcie narasta poczucie alienacji obywateli wobec zautomatyzowanych systemów, a technologiczna obietnica racjonalizacji debaty ustępuje miejsca skrajnej polaryzacji.

Teoretyczne ramy cyfrowego dyskursu

Zrozumienie mechanizmów rządzących współczesnym językiem polityki wymaga osadzenia zjawisk technologicznych w solidnych ramach socjologicznych i prawnych. Poniżej przedstawiono analizę najistotniejszych perspektyw teoretycznych, obejmujących degradację sfery publicznej, zjawisko baniek filtrujących oraz zagrożenia związane z nowymi formami cenzury.

Nowy strukturalny rozwój sfery publicznej według Habermasa

Punktem wyjścia do analizy patologii w cyfrowej komunikacji politycznej jest klasyczna teoria sfery publicznej (niem. Öffentlichkeit), sformułowana przez niemieckiego filozofa Jürgena Habermasa w 1962 roku w dziele „Strukturwandel der Öffentlichkeit”. Habermas opisywał historyczny proces kształtowania się mieszczańskiej sfery publicznej, opartej na racjonalnej, równej debacie, wolnej od przymusu państwowego. Sfera ta, funkcjonująca jako medium między państwem a społeczeństwem obywatelskim, z czasem uległa degeneracji na skutek komercjalizacji mediów masowych.

Pojawienie się globalnej sieci internetowej początkowo wzbudziło nadzieje na rewitalizację partycypacyjnej demokracji. Jednakże, w swoim eseju „Ein neuer Strukturwandel der Öffentlichkeit und die deliberative Politik” (2022), Habermas (Habermas, 2022) dokonuje krytycznej rewizji swoich dawnych nadziei. Autor wskazuje, że cyfryzacja doprowadziła do radykalnej defragmentacji dyskursu publicznego. Zamiast uniwersalnego forum, otrzymaliśmy rozdrobnione „pół-publiczności” (semi-publics), a logika komercyjnych platform społecznościowych systematycznie niszczy warunki niezbędne do racjonalnej, deliberatywnej polityki.

W świecie rządzonym przez ekonomię uwagi (attention economy), uwaga obywateli jest monetyzowana za pomocą algorytmów promujących treści wzbudzające największe zaangażowanie emocjonalne. Jak wskazuje Habermas, platformy cyfrowe zacierają granice między komunikacją prywatną a publiczną, przekształcając obywateli z powrotem w odizolowanych konsumentów informacji (Habermas, 2022).

Bańki filtrujące i afektywna polaryzacja w polskim Internecie

Bezpośrednim następstwem opisanego wyżej zjawiska defragmentacji jest narastająca radykalizacja postaw. W literaturze przedmiotu zjawisko to opisuje koncepcja „bańki filtrującej” (filter bubble), spopularyzowana przez Eliego Parisera. Personalizacja treści, będąca fundamentem algorytmów rekomendacyjnych, drastycznie zmniejsza prawdopodobieństwo zetknięcia się użytkownika z poglądami sprzecznymi z jego własnymi. Prowadzi to do powstania hermetycznych ekosystemów informacyjnych.

W kontekście polskim problem ten jest poddawany intensywnym badaniom. Analizy aktywności na Twitterze (obecnie X) wykazują, że o ile sama platforma nie wymusza drastycznych zmian w wewnętrznych przekonaniach użytkowników, o tyle zmienia ona strukturę ich wzajemnych relacji i utrwala podziały sieciowe (Parmelee & Bichard, 2012).

Najnowszy raport badawczy Fundacji Niezależne Media i Uniwersytetu SWPS („Stan polaryzacji 2025”), przeprowadzony na reprezentatywnej próbie 2351 osób, dowodzi katastrofalnych skutków tego zjawiska. Z pełnym raportem można się zapoznać w dokumencie Stan polaryzacji 2025. Pomiary obejmujące najważniejsze kwestie społeczno-polityczne wskazują, że różnice napędzane przez media cyfrowe przyjmują wymiar głęboko afektywny – oznaczający autentyczną wrogość i alienację wobec osób o odmiennych poglądach. Cyfrowe środowisko informacyjne, projektowane z wykorzystaniem uczenia maszynowego (machine learning), automatyzuje zatem proces izolacji (Adamik-Szysiak, 2019).

Informatyka na dziś - Bańka Informacyjna — Proces zatapiania użytkownika w bańce informacyjnej (źródło: https://www.drmalinowski.edu.pl/posts/2635-banka-informacyjna)

Konstytucyjne prawo a „prywatyzacja cenzury”

Aspektem łączącym rozważania socjologiczne z praktyką Data Science jest problematyka wolności wypowiedzi i cenzury. Konstytucja Rzeczypospolitej Polskiej, w artykule 54 ustęp 2, stanowczo zakazuje cenzury prewencyjnej środków społecznego przekazu. Historycznie cenzura prewencyjna wymagała przedłożenia tekstu organom władzy przed jego publikacją (Kosiorowski, 2019).

W dobie sztucznej inteligencji pojęcie cenzury uległo redefinicji. Zautomatyzowane systemy moderacji, działające w oparciu o algorytmy NLP, potrafią filtrować i blokować treści w milisekundach. Zjawisko to badacze nazywają „prywatyzacją cenzury” lub „komercjalizacją propagandy”. Niezawisłe organy sprawiedliwości ustąpiły miejsca programistom, którzy narzucają „kodeksy społeczności” egzekwowane bezwzględnie przez skrypty i sieci neuronowe. To rodzi dylemat etyczny: oprogramowanie staje się ostatecznym prawem (code is law), de facto odbierając obywatelom prawo do jawnej i transparentnej deliberacji publicznej.

Stronniczość modeli NLP i epistemologiczny bunt użytkowników

Zastosowanie systemów AI w polityce wykracza poza samo ukrywanie postów. Obywatele masowo wykorzystują Wielkie Modele Językowe (Large Language Models – LLMs), takie jak ChatGPT, Claude czy modele z rodziny LLaMA, do pozyskiwania informacji, tworzenia podsumowań i oceniania wypowiedzi polityków. W obiegowej opinii maszyny uchodzą za bezstronne matematyczne konstrukty, lecz badania naukowe dowodzą, że w rzeczywistości są głęboko obarczone ukrytymi wartościowaniami.

Skrzywienie ideologiczne (Political Bias) w LLM

Ewaluacja uprzedzeń modeli jest wyzwaniem naukowym. Badania przeprowadzone przez A. Halla, S. Westwooda i J. Grimera z Uniwersytetu Stanforda, przy użyciu metodyki „odpowiedzi o trafności ekologicznej” (ecologically validated responses), dowodzą ponad wszelką wątpliwość, że najpopularniejsze modele wykazują zauważalne skrzywienie w stronę postaw lewicowych (left-leaning slant) (Hall et al., 2025). Inżynierowie mogą – dzięki odpowiednim modyfikacjom na etapie promptowania – sprowadzić modele do pozycji bardziej neutralnych, jednak domyślne wagi modeli faworyzują określoną wizję świata.

Podobne wnioski płyną z badań nad modelem IssueBench prowadzonych przez zespół Paula Röttgera (Röttger, 2025). Wyniki wskazują na silną zbieżność odpowiedzi AI ze stanowiskami Demokratów w USA w kluczowych politykach społecznych. Niezwykle interesujące są eksperymenty analizujące „dynamikę opinii” (opinion dynamics) podczas symulowanych debat pomiędzy autonomicznymi agentami LLM (Chuang et al., 2024). Udowodniono, że agenci zaprogramowani jako „konserwatyści”, w toku algorytmicznej dyskusji mają tendencję do przesuwania swoich argumentów w kierunku centrum, podczas gdy agenci „liberalni” oraz neutralni zachowują stałość postaw.

Wynika to w dużej mierze z tzw. uprzedzenia dotyczącego bezpieczeństwa (safety bias) nakładanego na modele podczas treningu (RLHF – Reinforcement Learning from Human Feedback), co wymusza unikanie narracji uznawanych w korporacjach technologicznych za niebezpieczne, a tym samym kształtuje określony polityczny konsensus algorytmiczny.

Kompas polityczny modeli językowych (źródło: https://trackingai.org/political-test)

Narzędzia Data Science do obiektywizacji języka polityki w Polsce

Pomimo mrocznego obrazu korporacyjnej moderacji, technologie Data Science posiadają niezwykły potencjał emancypacyjny. Otwarty kod źródłowy (open-source) oraz publiczne inicjatywy badawcze stanowią fundament dla obywatelskiego audytu sfery politycznej. Polska dysponuje na tym polu jednym z najbardziej zaawansowanych na świecie środowisk lingwistycznych, umożliwiających matematyczną precyzję w badaniu ewolucji języka polityki.

Korpus Dyskursu Parlamentarnego (KDP)

Osiągnięciem o fundamentalnym znaczeniu dla polskiej humanistyki cyfrowej jest powstanie Korpusu Dyskursu Parlamentarnego (KDP), realizowanego w ramach europejskiego konsorcjum badawczego CLARIN-PL, pod kierownictwem Macieja Ogrodniczuka (Ogrodniczuk, 2018). KDP to monumentalny zbiór zdygitalizowanych i ustrukturyzowanych tekstów, zawierający pełne stenogramy obrad polskiego parlamentu od 1919 roku do dnia dzisiejszego.

Korpus ten, integrujący dane historyczne (II RP, PRL) z bieżącymi pracami Sejmu i Senatu III RP, zawiera obecnie ponad 43 miliony w pełni zanalizowanych tokenów (słów i znaków interpunkcyjnych). Dane pozyskiwane dzięki uprzejmości Kancelarii Sejmu i Senatu dostępne są w domenie publicznej, co pozwala na transparentne badania. Przetwarzanie i lematyzacja tekstów, nierzadko historycznych i zawierających archaizmy oraz błędy OCR, opiera się na kaskadzie specjalistycznych programów.

W poniższej tabeli zestawiono kluczowe moduły analityczne napędzające architekturę KDP, opracowane przez polskich badaczy:

Nazwa Modułu	Funkcja i Zastosowanie w Przetwarzaniu Dyskursu
Morfeusz SGJP	Odpowiada za segmentację tekstu (utterance-level), tokenizację oraz lematyzację form morfologicznych polszczyzny.
Pantera	Moduł odpowiedzialny za dezambiguację (jednoznaczne rozstrzyganie) skomplikowanych opisów morfosyntaktycznych.
Spejd	Parser przeprowadzający analizę składniową – wykrywa syntaktyczne grupy słów w zdaniach posłów.
Nerf	Implementacja modelu rozpoznawania bytów nazwanych (Named Entity Recognition). Pozwala wykrywać odniesienia do osób, organizacji i lokacji.
Smyrna / Poliqarp	Złożone silniki wyszukiwawcze pozwalające na tworzenie zapytań lingwistycznych i statystycznych (np. zestawień n-gramów w wypowiedziach partii).

Drzewo składniowe (źródło: https://subscription.packtpub.com/book/data/9781784391799/7/ch07lvl1sec44/understanding-parse-trees)

Dzięki tak zbudowanej infrastrukturze (reprezentowanej w formacie TEI P5), dziennikarz śledczy lub politolog może w kilka sekund przeanalizować, w jaki sposób zmieniała się retoryka i nastawienie do poszczególnych tematów w wypowiedziach partii na przestrzeni ostatnich dekad (Ogrodniczuk, 2018). Stanowi to potężne, organizacyjne ramy dla obywatelskiego fact-checkingu opartego na historycznych danych empirycznych.

Obywatelskie zastosowania danych masowych

Technologiczne zasoby znajdują odzwierciedlenie w organizacjach typu watchdog. Inicjatywy takie jak „Sejmometr.pl” czy działający pod egidą Stowarzyszenia 61 portal „MamPrawoWiedziec.pl”, masowo pobierają i wizualizują dane otwartego rządu (Open Government Data). Zgromadzenie blisko 5TB informacji, obejmujących akty prawne, wyniki głosowań w jednostkach samorządu terytorialnego i oświadczenia majątkowe, pozwala na śledzenie w czasie rzeczywistym powiązań kapitałowych i afiliacji politycznych. Systemy te nie ingerują w treść (jak systemy cenzurujące), lecz eksponują ukryte wzorce polityczne dla dobra ogółu.

Zaawansowane modele analizy wydźwięku emocjonalnego: od HerBERTa do RoBERTa-8k

Choć klasyczne moduły analizy lingwistycznej znakomicie sprawdzają się na poprawnej polszczyźnie z mównicy sejmowej, zawodzą w konfrontacji z potocznym, zniekształconym afektywnie językiem Twittera (X) czy komentarzy pod postami. Rozwiązaniem okazały się Głębokie Modele Językowe oparte na architekturze Transformerów.

Przełomem dla analizy języka polskiego było stworzenie modelu HerBERT, zaproponowanego przez zespół pod kierunkiem P. Rybaka (Rybak et al., 2020). Model ten (oparty na architekturze BERT), wytrenowany na polskojęzycznych korpusach przy użyciu funkcji celu MLM (Masked Language Modeling), pozwolił na głębokie zrozumienie semantyczne polskiego słownictwa. Skuteczność modeli mierzona jest dzięki zestawowi benchmarków KLEJ, uwzględniającemu np. analizę wydźwięku emocjonalnego.

Społeczność platformy Hugging Face szybko udostępniła wyspecjalizowane warianty HerBERTa, takie jak model bardsai/twitter-sentiment-pl-base, który poddano procesowi douczania (fine-tuning) na polskojęzycznych odpowiednikach zbiorów typu TweetEval. Model ten potrafi z chirurgiczną precyzją przyporządkowywać wpisy do klas: pozytywny, negatywny i neutralny. W zastosowaniach finansowo-rynkowych używa się pochodnych modelu trenowanych na słowniku Financial PhraseBank (bardsai/finance-sentiment-pl-base).

Z kolei dla potrzeb podsumowywania ekstremalnie długich dokumentów politycznych, np. wielostronicowych projektów ustaw lub całych debat, inżynierowie z PKO BP udostępnili model polish-roberta-8k. Model ten, poprzez modyfikację osadzeń pozycyjnych (positional embedding) i trening z mechanizmem Flash Attention 2, potrafi przyjąć kontekst do 8192 tokenów, zachowując parametry wyższego rzędu niż komercyjne LLM. Daje to nieograniczone niemal możliwości tworzenia automatycznych kompendiów prawa.

Poniższa tabela porównuje współczesne narzędzia wykorzystywane do analizy polskiego dyskursu politycznego:

Model / Technologia	Podstawa Architektury	Główne Przeznaczenie w Badaniach Politycznych	Kontekst / Okno Tokenów
Morfeusz SGJP (KDP)	Algorytmy regułowe / Słowniki	Tagowanie gramatyczne stenogramów historycznych, lematyzacja.	Zdanie / Wypowiedź
HerBERT (bardsai)	Transformer (BERT) / MLM	Błyskawiczna analiza wydźwięku emocjonalnego i detekcja hejtu na X.	512 tokenów
RoBERTa-8k (Polish)	Transformer (RoBERTa)	Klasyfikacja wielostronicowych ustaw i pełnych sprawozdań z komisji.	8192 tokenów

Dlaczego kolejne, lepsze generacje modeli AI nie uleczą naszej demokracji?

Zderzenie akademickich teorii socjologicznych Habermasa z twardymi osiągnięciami polskiego inżynierstwa Data Science (KDP, HerBERT) oraz z praktykami cenzorskimi platform społecznościowych (Big Tech) ukazuje fundamentalny, nierozwiązany dotąd konflikt w nowoczesnych państwach demokratycznych.

Głównym paradygmatem korporacji Doliny Krzemowej jest twierdzenie, że ich modele AI do moderacji politycznej zachowują neutralność światopoglądową. Opierając się na przeanalizowanych tekstach źródłowych oraz badaniach ze Stanfordu (Hall et al., 2025), zdecydowanie odrzucamy to stanowisko. Model uczenia maszynowego nie działa w aksjologicznej próżni. Skrzywienia modelu wynikają z faktu, że tzw. uczenie nadzorowane i nagradzanie modeli ludzką informacją zwrotną (RLHF) przeprowadzane jest przez osoby o zdefiniowanych preferencjach (przeważnie liberalnych środowisk technologicznych), co wymusza na maszynach tzw. „konsensus wyrównujący” (equity-consensus bias). Jak ujawniły badania nad dynamiką wirtualnych debat modeli, konserwatywne modele ustępują przed lewicowymi, ponieważ „postawa neutralna” w ujęciu deweloperów leży bliżej lewej strony spektrum politycznego.

Porównując infrastrukturę polskiego środowiska akademickiego z architekturą algorytmów na Twitterze czy Facebooku, uderza całkowicie odmienna filozofia transparentności. Twórcy Korpusu Dyskursu Parlamentarnego zbudowali swoją aplikację na fundamentach otwartej nauki. Każdy tag nadany słowu może być zweryfikowany; każdy skrypt udostępniony jest badaczowi do wglądu (Ogrodniczuk, 2018). Obywatelskie portale jak Sejmometr nie oceniają polityka, ale dostarczają obywatelowi zestaw surowych danych statystycznych. Tymczasem sieci społecznościowe stosują prywatne modele typu „black-box”. Nie wiemy, jakie wagi decyzyjne stoją za redukcją zasięgów (shadowban). Oznacza to urzeczywistnienie najgorszych koszmarów klasycznej teorii sfery publicznej (Habermas, 2022): sprywatyzowanie miejsca publicznej deliberacji, w którym niewyjaśnialne algorytmy sterują przepływem opinii, podbijając afektywną polaryzację zdiagnozowaną w badaniach środowiska Uniwersytetu SWPS. Zautomatyzowana prewencyjna moderacja bez podania matematycznej przyczyny narusza literę wolności wypowiedzi konstytucyjnej (Kosiorowski, 2019).

Uważamy zatem, że techno-optymizm zakładający, iż udoskonalenie modeli językowych samoistnie usunie z debaty publicznej hejt i fałsz, jest założeniem zbyt idealistycznym. Implementacja bardziej „zaawansowanych” modeli fact-checkingowych nie przywróci zaufania publicznego, ponieważ obywatele intuicyjnie (i słusznie) buntują się przeciwko arbitralnemu sędziowaniu maszyn. Rozwiązaniem polaryzacji nie jest delegowanie osądu społecznego nowej iteracji LLM-a, lecz wprowadzenie odpowiednich ram prawnych, które zapewnią transparentność działania algorytmów.

Zastosowanie koncepcji Explainable AI (XAI) do audytu modeli NLP

Odpowiedzią na wyartykułowany kryzys braku zaufania do cenzurujących algorytmów oraz poczucia politycznej alienacji jest systemowe wdrożenie technik Wyjaśnialnej Sztucznej Inteligencji (Explainable AI – XAI). Badania interakcji człowieka z komputerem dowodzą empirycznie, że gdy użytkownikowi prezentowany jest obok wyniku etykieta ze wskaźnikami wyjaśniającymi logikę predykcji, zjawisko odrzucenia i polaryzacji znacznie maleje.

W domenie przetwarzania języka naturalnego królują metody takie jak LIME (Local Interpretable Model-Agnostic Explanations) i SHAP (SHapley Additive exPlanations). Metoda SHAP to wyrafinowana technika matematyczna oparta na kooperacyjnej teorii gier Shapleya. Pozwala ona wyliczyć wkład (wartość Shapleya) każdej pojedynczej cechy (np. określonego tokena, wyrazu w dokumencie) w ostateczny wynik analizy sieci neuronowej.

Jako praktyczne rozwiązanie informatyczne, niwelujące problem „czarnej skrzynki” dla polskiego obywatela korzystającego z portalu fact-checkingowego, proponujemy zintegrowanie metody SHAP z analizatorem HerBERT. Poniżej zamieszczono demonstracyjny fragment kodu w języku Python, służący do oceny wypowiedzi polityków.

import torch
import transformers
import shap
import scipy as sp
import numpy as np

# 1. Załadowanie polskiego modelu do analizy wydźwięku emocjonalnego
MODEL_NAME = "bardsai/twitter-sentiment-pl-base"
tokenizer = transformers.AutoTokenizer.from_pretrained(MODEL_NAME)
model = transformers.AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)

# 2. Definicja pipeline'u
nlp_pipeline = transformers.pipeline(
    "sentiment-analysis", 
    model=model, 
    tokenizer=tokenizer, 
    return_all_scores=True 
)

# 3. Funkcja f mapująca tekst na prawdopodobieństwa (wymagana przez SHAP)
def f(x):
    # Tokenizacja wejścia tekstowego i konwersja na tensory PyTorch
    inputs = tokenizer(x.tolist(), return_tensors="pt", padding=True, truncation=True)
    with torch.no_grad():
        outputs = model(**inputs).logits
    # Konwersja logitów na prawdopodobieństwa klas (0-1)
    scores = torch.nn.functional.softmax(outputs, dim=-1).cpu().numpy()
    return scores

# 4. Inicjalizacja wyjaśniacza SHAP dla modeli tekstowych
explainer = shap.Explainer(f, tokenizer)

# 5. Tekst do analizy
polityczny_tweet = (
    "Ustawa forsowana przez opozycję to całkowity absurd i zniszczy naszą gospodarkę! "
    "Jedynie jeden punkt dotyczący dofinansowań okazał się umiarkowanie dobry."
)

# 6. Obliczenie wartości Shapleya (atrybucja cech)
shap_values = explainer([polityczny_tweet])

# 7. Wyświetlenie interaktywnej wizualizacji wpływu słów
shap.plots.text(shap_values)

Wdrożenie powyższej architektury nie tylko demaskuje uprzedzenia ukryte w modelach językowych, ale także wyhamowuje efekt mrożący (chilling effect) w społeczeństwie. Obywatel, zamiast binarnej inwigilacji, otrzymuje pełnoprawny, demokratyczny wgląd w reguły decyzyjne algorytmu. Tym samym technologia staje się z powrotem służebna względem debaty, a narzędzia Data Science zaczynają funkcjonować jak szkło powiększające dla sfery publicznej, chroniące zarazem konstytucyjne wartości o wolności słowa i przekazu.

Konkluzja

Algorytmizacja dyskursu politycznego stała się w trzeciej dekadzie XXI wieku nieodwracalnym faktem. Analiza wpływu nowoczesnych narzędzi Data Science na sferę publiczną i etykę uświadamia dualną naturę sztucznej inteligencji. Jak dowodzą koncepcje filozoficzne, infrastruktury potężnych podmiotów technologicznych monetyzują uwagę społeczeństw i eskalują polaryzację, dając ułudę wolności podczas stosowania prewencyjnej cyfrowej cenzury. Modele oceniające treści potrafią same wykazywać skrzywienia ideologiczne, a ich zamknięty w „czarnej skrzynce” charakter budzi zrozumiały opór obywateli broniących wolności opinii.

Mimo to, otwarte rozwiązania technologiczne budowane m.in. przez polskie instytucje udowadniają, że technologia może sprzyjać transparentności. Monstrualny zbiór wiedzy, jakim jest Korpus Dyskursu Parlamentarnego, uzbrojony we flagowe zdobycze dziedziny przetwarzania języka polskiego, takie jak struktury HerBERTa i modele zdolne przetwarzać gigantyczne dokumenty urzędowe, stanowi unikalne narzędzie badawcze do obiektywizacji faktograficznej i ochrony racjonalnego języka państwowego.

Złotym środkiem prowadzącym do idei „Make Political Discourse Great Again” jest wymuszenie legislacyjnego mariażu modeli analitycznych z systemami Wyjaśnialnej Sztucznej Inteligencji, takimi jak biblioteki SHAP i LIME. Pozwoli to wyrwać władzę dyskrecjonalnej moderacji z rąk niewidzialnych korporacyjnych weryfikatorów, przekazując narzędzia do zrozumienia świata z powrotem w ręce samych obywateli, dla których i przez których polityka została stworzona.

Literatura

Habermas, J. (2022). Ein neuer Strukturwandel der Öffentlichkeit und die deliberative Politik. Suhrkamp Verlag.
Hall, A., Westwood, S., & Grimmer, J. (2025). Measuring Perceived Slant in Large Language Models Through User Evaluations. Stanford Graduate School of Business Research Papers, 1-30.
Kosiorowski, Z. (2019). Piractwo internetowe a wolność słowa i dostępu do treści w internecie. Media Management, 7(1), 29-44.
Ogrodniczuk, M. (2018). Polish Parliamentary Corpus. Proceedings of the LREC 2018 Workshop ParlaCLARIN, 15–19.
Rybak, P., Mroczkowski, R., Tracz, J., & Gawlik, I. (2020). KLEJ: Comprehensive Benchmark for Polish Language Understanding. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 1191–1201.

Tags: #bańkainformacyjna, #polaryzacja, #polityka, #sztucznainteligencja, AI, cenzura, Data Science, LLM, NLP, XAI