Home » AGH 2025/26 » Ciało na podsłuchu: Uwaga, obciążenie poznawcze i pobudzenie emocjonalne w środowiskach AR i VR

Ciało na podsłuchu: Uwaga, obciążenie poznawcze i pobudzenie emocjonalne w środowiskach AR i VR

By Szymon Mamoń and Szymon Twardosz in AGH 2025/26 on 1 czerwca, 2026

Spread the love

Gogle wirtualnej (VR) i rozszerzonej (AR) rzeczywistości przestały być wyłącznie urządzeniami do wyświetlania obrazu. Za sprawą postępującej miniaturyzacji i spadku kosztów sensorów, stały się one zaawansowanymi stacjami pomiarowymi, które w czasie rzeczywistym monitorują fizjologię użytkownika. Śledzenie wzroku (eyetracking), elektroencefalografia (EEG), analiza ruchu ciała (kinematyka) czy reakcja skórno-galwaniczna (GSR) pozwalają nam zajrzeć pod maskę ludzkiej świadomości.

W tym wpisie przyjrzymy się temu, co fizjologia mówi o naszym zachowaniu w wirtualnych światach. Omawiając aktualne doniesienia naukowe, zarysujemy prawdziwy potencjał stojący za wykorzystaniem danych biometrycznych w nowych technologiach. Zwrócimy również uwagę na ograniczenia sprzętu i metodyki, wskazując, gdzie kończą się rzetelne pomiary, a zaczynają zwykłe nadinterpretacje.

Ciało jako interfejs: Co tak naprawdę mierzymy?

Aby zrozumieć, jak systemy AR i VR interpretują nasz stan, musimy najpierw rozłożyć na czynniki pierwsze „język” ludzkiego ciała rejestrowany przez sensory. W badaniach nad immersją najczęściej wykorzystuje się cztery filary biometryczne:

Eyetracking (Śledzenie wzroku): Nowoczesne gogle rejestrują nie tylko to, na co patrzymy, ale przede wszystkim jak patrzymy. Algorytmy mierzą czas trwania fiksacji, częstotliwość mrugania oraz mikrometryczne zmiany w średnicy źrenicy.

Rozkład sensorów wykorzystywanych w badaniu EEG źródło brainaccess.ai
GSR / EDA (Reakcja skórno-galwaniczna): Sensory umieszczone zazwyczaj na palcach lub dłoni mierzą mikroskopijne zmiany w przewodnictwie elektrycznym skóry, wynikające z aktywności gruczołów potowych.

EEG (Elektroencefalografia): Elektrody wbudowane w gogle (lub specjalne opaski) mierzą aktywność elektryczną kory mózgowej, co ułatwia m.in. mapowanie stanów ekstremalnego skupienia lub znużenia i obciążenia układu nerwowego.
Ruch ciała i postawa: Sensory inercyjne (IMU) śledzą kinematykę – mikrotremory (naturalne drżenie mięśni) dłoni, płynność ruchów głowy czy ogólną postawę ciała.

Streamer Gucio, śledzi oczami pieska na kosiarce (źródło twitch.tv/h2p_gucio)

Obciążenie poznawcze: Kiedy mózg „dławi się” danymi

Zgodnie z klasyczną Teorią Obciążenia Poznawczego (Cognitive Load Theory) zaproponowaną przez Johna Swellera [1], nasza pamięć robocza ma wysoce ograniczoną pojemność. W środowiskach AR/VR, gdzie jesteśmy bombardowani bodźcami 3D, dźwiękiem przestrzennym i nierzadko złożonymi, nowymi interfejsami, bardzo łatwo przekroczyć próg optymalnego przetwarzania informacji.

Teoria obciążenia poznawczego Johna Swellera - poznaj jej podstawowe założenia — Żródło: pieknoumyslu.com

Jak sensory zdradzają, że nasz mózg jest przeciążony? W neuroergonomii polega się tu głównie na analizie fuzji danych z eyetrackingu oraz EEG. Wykazano na przykład, że średnica źrenicy powiększa się proporcjonalnie do nakładu wysiłku mentalnego [2]. Co więcej, gdy użytkownik gubi się w interfejsie VR i jego obciążenie poznawcze rośnie, radykalnie zmienia się sam wzorzec patrzenia: częstotliwość mrugnięć przyspiesza, a fiksacje stają się chaotyczne.

Zapis EEG dostarcza w takich momentach równie precyzyjnych wzorców. Spadek aktywności fal Alfa przy jednoczesnym wzroście fal Theta w płacie czołowym bardzo często koreluje z momentami ostrego wysiłku poznawczego i frustracji w zderzeniu z cyfrowym zadaniem.

Można wręcz dojść do wniosku, że era tradycyjnych ankiet badających User Experience powoli ewoluuje. Ocenianie poziomu trudności wyłącznie na podstawie deklaracji bywa złudne – użytkownicy VR nierzadko racjonalizują swoje pomyłki i błędnie określają momenty, w których ich pamięć robocza była przeciążona. Biometria pozwala na obiektywne śledzenie ułamków sekund, wykraczając daleko poza omylną introspekcję.

Pobudzenie emocjonalne: Anatomia wirtualnego stresu

Drugim fundamentem diagnostyki stanu psychicznego w wirtualnej rzeczywistości jest ocena pobudzenia emocjonalnego (Arousal). W tym ujęciu absolutnie dominującą rolę odgrywa pomiar reakcji skórno-galwanicznej (GSR), wsparty oceną dynamiki uderzeń serca i oddechu.

Kiedy w wirtualnym środowisku pojawia się bardzo silny bodziec – wirtualny lęk wysokości na symulowanej krawędzi budynku, wypadek w symulatorze jazdy, czy gwałtowny skok stresu podczas cyfrowego wystąpienia publicznego – nasz współczulny układ nerwowy uruchamia reakcję „walcz lub uciekaj”. W efekcie opór elektryczny skóry ulega natychmiastowemu obniżeniu [3].

To jednak właśnie tu krzyżują się ścieżki rzetelnej nauki z bardzo powierzchownym neuromarketingiem. Według uznanego w psychologii modelu afektu autorstwa Jamesa Russella [4], emocje rozpatruje się zawsze w dwóch wymiarach: siły pobudzenia (Arousal) oraz znaku/walencji (Valence – tego, czy dana emocja jest przyjemna, czy też negatywna i odpychająca). Badania jasno dowodzą, że wskaźnik GSR odczytuje wyłącznie skalę pobudzenia.

W praktyce oznacza to tyle, że niewielki czujnik na dłoni użytkownika nie ma szans odróżnić gwałtownego wydzielania potu wywołanego entuzjazmem ze zdobycia punktów w grze od przerażenia po zobaczeniu cyfrowego pająka. Traktowanie samych pików oporności skóry jako ostatecznego dowodu na „pozytywne zaangażowanie” produktu to kardynalny błąd. Samo pobudzenie nie wystarczy do oceny pozytywnego doświadczenia. Zjawisko to należy odczytywać ze szczególną ostrożnością, mając również na uwadze, że samo immersyjne środowisko 3D prowokuje o wiele wyższe pobudzenie emocjonalne w stosunku do klasycznych, płaskich ekranów.

Dlaczego musimy łączyć dane?

Rozumiejąc ułomności poszczególnych kanałów informacyjnych, zaawansowane placówki badawcze i współczesna neuroinformatyka zmierzają wyłącznie w stronę systemów multimodalnych. Zestawienie wielu wskaźników równocześnie pozwala uzyskać pełny obraz poznawczy:

Rozszyfrowanie emocji: Łącząc zauważalny odczyt GSR (potwierdzający duże pobudzenie) z mapowaniem źrenicy (które skupia się z zainteresowaniem na centralnym obiekcie), jesteśmy o wiele bliżej zdiagnozowania ekscytacji. Jeśli jednak wysoki wskaźnik GSR występuje u użytkownika o zamkniętej i wycofanej postawie ciała z nerwowym błądzeniem wzroku po obrzeżach symulacji – można być pewnym, że rejestrowanym stanem jest silny dyskomfort.
Ocena Flow: Bardzo niski lub wyrównany odczyt pulsu spleciony z długimi, ukierunkowanymi fiksacjami gałek ocznych to fizjologiczny obraz całkowitego wejścia w zadanie – tzw. stanu flow.

Prawidłowa fuzja danych biometrycznych to przyszłość „inteligentnych” systemów AR i VR, które same zrozumieją, kiedy obniżyć poziom natłoku powiadomień na wirtualnych ekranach, a kiedy docisnąć ucznia mocniejszym bodźcem w symulatorze.

Ta fuzja nie zachodzi jednak automatycznie. Przejście od teorii do praktycznych systemów multimodalnych wymaga zaawansowanej inżynierii danych. Pojedyncze sensory dostarczają bowiem jedynie strumieni surowych, pozbawionych kontekstu liczb. Prawdziwa rewolucja w interpretacji stanu psychicznego użytkownika zachodzi na poziomie tzw. fuzji danych (data fusion), gdzie zaawansowane algorytmy uczenia maszynowego integrują heterogeniczne sygnały w spójny model psychofizjologiczny.

Proces ten napotyka ogromne wyzwania, z których największym jest synchronizacja czasowa (latency match). Ludzkie ciało reaguje na bodźce w bardzo różnym tempie. Reakcja kory mózgowej rejestrowana przez EEG mierzona jest w milisekundach. Ruch gałek ocznych (eyetracking) wykazuje opóźnienie rzędu kilkudziesięciu milisekund. Tymczasem reakcja skórno-galwaniczna (GSR) to proces niezwykle powolny – pik potliwości pojawia się w układzie współczulnym często dopiero od 2 do 5 sekund po wystąpieniu bodźca. Skalibrowanie tak drastycznych przesunięć czasowych w dynamicznym środowisku XR wymaga stosowania skomplikowanych modeli matematycznych i dynamicznego okienkowania danych w czasie rzeczywistym.

Dodatkowo inżynierowie oprogramowania stają przed dylematem wyboru między fuzją wczesną (Early Fusion) a późną (Late Fusion). Wczesna fuzja polega na łączeniu surowych wektorów cech ze wszystkich czujników jeszcze przed podaniem ich do sieci neuronowej. Pozwala to modelom głębokim na wykrywanie subtelnych, ukrytych korelacji między mrugnięciem oka a mikrodrżeniem dłoni. Z kolei fuzja późna najpierw osobno interpretuje stany cząstkowe (np. osobno klasyfikuje zmęczenie wzroku i osobno poziom pobudzenia z GSR), a dopiero na końcu agreguje te wnioski.

Performance Comparison Between Early Fusion and Late Fusion in Video Analysis | by Chao Zhang | Medium — Late Fusion vs Early Fusion. Źródło: chaozhangchn.medium.com

To właśnie te algorytmy sztucznej inteligencji stanowią niewidzialny silnik, który potrafi przełożyć biomechaniczny szum na precyzyjną mapę naszej psychiki. Bez zaawansowanych sieci neuronowych zdolnych do filtrowania artefaktów mięśniowych (wywołanych choćby ruchem głowy czy mruganiem), multimodalna biometria pozostałaby jedynie zestawem chaotycznych wykresów, a nie narzędziem głębokiej inwigilacji czy zaawansowanej diagnostyki medycznej.

Prywatność neurobiologiczna: Psychografia i cicha diagnoza medyczna

W tym miejscu przechodzimy od kwestii czysto technicznych do najbardziej realnego zagrożenia związanego z technologiami immersyjnymi. W literaturze naukowej zyskało ono już swoją oficjalną nazwę: psychografia biometryczna (biometric psychography). Zaledwie krótka sesja w goglach VR wystarczy, aby system zebrał profil danych, o jakim tradycyjne media społecznościowe mogły tylko pomarzyć. Szacuje się, że zaledwie 20 minut spędzonych w VR generuje około 2 miliony unikalnych rejestrów ruchów ciała – od mikrosekundowych drgnięć głowy, przez motorykę rąk, aż po reakcje gałek ocznych [5].

Dla producenta sprzętu komercyjnego te miliony punktów danych to bezcenne źródło wiedzy o podświadomości użytkownika.

Od ruchu gałek ocznych do poglądów politycznych

Profilowanie behawioralne, które znamy (znane choćby z afery Cambridge Analytica), opierało się na analizie tego, co świadomie polubiliśmy w sieci. W środowisku XR system wykorzystuje mechanizm ukrytych skojarzeń i reakcji odruchowych.

Podczas zwykłej rozgrywki lub wirtualnego spaceru użytkownik mijający cyfrowe obiekty (np. symbole religijne, nagłówki gazet czy hasła społeczne) nawet nie musi rejestrować ich obecności. Wbudowany eyetracking odnotuje jednak, że wzrok zatrzymał się na danym elemencie o 150 milisekund dłużej, a źrenica minimalnie się rozszerzyła, co oznacza podświadome zaangażowanie poznawcze. Ponieważ osoby o skrajnych poglądach ideologicznych różnią się fizjologiczną reakcją na bodźce związane z nowością czy zagrożeniem, algorytmy krzyżujące dane z eyetrackingu i GSR są w stanie z wysokim prawdopodobieństwem określić profil światopoglądowy człowieka bez zadania ani jednego pytania.

Ciche badanie neurologiczne w tle

Jeszcze głębsza ingerencja zachodzi na poziomie analizy aktywności mózgowej. Integracja elastycznych elektrod i czujników fizjologicznych bezpośrednio w pianki gogli XR pozwala na stałe, pasywne badanie parametrów użytkownika. Modele głękopiego uczenia maszynowego potrafią dziś analizować gęstość widmową mocy fal mózgowych z dokładnością niedostępną dla ludzkiego oka.

W ten sposób, podczas wykonywania standardowych zadań w VR, algorytm jest w stanie zidentyfikować schorzenia neuropatyczne. Specyficzne zaburzenia komunikacji między wzgórzem a korą mózgową objawiają się w EEG jako nietypowy wzrost aktywności fal. Zanim pojawią się pierwsze kliniczne objawy chorób takich jak Alzheimer czy Parkinson, modele wykorzystujące środowisko VR potrafią wychwycić subtelne ułomności w orientacji przestrzennej i koordynacji motoryczno-wzrokowej.

Monopoly Man Sticker - Etsy Polska — Źródło: etsy.com

Dla medycyny to rewelacyjne narzędzie diagnostyczne. Jednak w komercyjnych ekosystemach, gdzie brak jest ścisłych regulacji medycznych, te intymne informacje mogą zostać łatwo zmonetyzowane przez brokerów danych. Do najpoważniejszych komercyjnych zastosowań tych profili należą:

Firmy ubezpieczeniowe: Podniesienie składek lub odmowa polis na życie na bazie wykrytych w EEG ryzyk neuropatycznych czy neurodegeneracyjnych [6].
Sztaby marketingowe: Serwowanie reklam precyzyjnie w chwilach, gdy zmierzone obciążenie poznawcze spada, drastycznie ograniczając opór psychiczny.
Systemy rekrutacyjne: Automatyczne odrzucanie kandydatów, których profil biometryczny wskazuje na gorszą podatność na stres chroniczny.

Granice interpretacji i pułapka cyfrowego trojana

Rosnące zaufanie do systemów monitorujących układ nerwowy zmusza nas do brutalnej weryfikacji etycznych, prawnych i poznawczych granic tej technologii. Istnieje ogromne ryzyko, że dając się uwieść magii immersji, zignorujemy moment, w którym technologia zacznie działać na naszą szkodę.

Mit „czytania w myślach”: Nawet doskonała maszyna mierzy wyłącznie „echo” zachodzących w mózgu procesów. Sprzęt błyskawicznie wychwyci anomalię we wzorcu mrugania, ale nie wytłumaczy nam, dlaczego nastąpiła. Gwałtowny skok stresu podczas użytkowania VR z pozoru może oznaczać problem z oprogramowaniem, choć w rzeczywistości użytkownik w realnym świecie właśnie przypomniał sobie o niezapłaconym mandacie. Biometria bez kontekstu pozostaje ślepa.
Standaryzacja, która krzywdzi: Stworzenie jednolitych algorytmów dla wszystkich napotyka twardy opór ze strony ludzkiej fizjologii. Poszczególne osoby różnią się grubością skóry, potliwością, a także naturalną częstotliwością fiksacji. Narzucanie sztywnych norm uderza chociażby w populację osób neuroatypowych, u których inna dynamika odpowiedzi fizjologicznej może generować u algorytmów nieustanne, fałszywe ostrzeżenia o rzekomym „przeciążeniu” czy niestabilności.
Zagrożenie inwigilacją totalną: Mierzenie i stałe profilowanie mimowolnych zmian fizjologicznych to bezprecedensowy zamach na naszą prywatność kognitywną. W przeciwieństwie do haseł czy kont w banku, własnej biologii nie da się zresetować ani zmienić. Raz stworzony profil Twoich podświadomych reakcji staje się permanentnym cyfrowym śladem, gotowym do wykorzystania przez korporacje, ubezpieczycieli czy algorytmy manipulacji wyborczej.

Nowy gadżet czy wyrafinowany system śledzenia?

Mariaż środowisk XR z danymi biometrycznymi całkowicie zmienia reguły gry w świecie nowych technologii. Musimy wreszcie zacząć nazywać rzeczy po imieniu i zdjąć różowe okulary zachwytu nad technologią: Istnieje duża szansa, że pod płaszczem nowego elektronicznego gadżetu, który dziś jest dla nas źródłem doskonałej zabawy, a z czasem zacznie być agresywnie reklamowany i sprzedawany jako narzędzie absolutnie niezbędne do codziennego życia i pracy, próbuje się nam wcisnąć najbardziej wyrafinowany system inwigilacji i śledzenia w historii ludzkości.

Oddając korporacjom bezpośredni, ułamkowy dostęp do reakcji naszych źrenic, potliwości skóry i fal mózgowych, dobrowolnie rezygnujemy z jednej z ostatnich wolnych przestrzeni, jakie nam pozostały – naszej własnej podświadomości. Jeśli nie postawimy twardych, bezwzględnych granic prawnych i nie zmusimy producentów do absolutnej ochrony tych danych, to bezlitosne narzędzie śledzenia prędzej czy później obróci się przeciwko nam. Prawdziwym wyzwaniem ery XR nie jest to, jak stworzyć bardziej immersyjny świat, ale to, jak w tym wirtualnym świecie obronić przed ostateczną inwigilacją naszą własną, ludzką autonomię.

Bibliografia:

[1] Sweller, J. (1988). „Cognitive load during problem solving: Effects on learning.” Cognitive Science, 12(2), 257-285.
[2] Beatty, J. (1982). „Task-evoked pupillary responses, processing load, and the structure of processing resources.” Psychological Bulletin, 91(2), 276-292.
[3] Meehan, M., Insko, B., Whitton, M., & Brooks, F. P. (2002). „Physiological measures of presence in stressful virtual environments.” ACM Transactions on Graphics (TOG), 21(3), 645-652.
[4] Russell, J. A. (1980). „A circumplex model of affect.” Journal of Personality and Social Psychology, 39(6), 1161–1178.
[5] Bailenson, J. N. (2018). „Protecting nonverbal data for the virtual reality age.” Berkeley Technology Law Journal, 33(4), 1229-1244.
[6] Farahany, N. A. (2023). The Battle for Your Brain: Defending the Right to Think Freely in the Age of Neurotechnology. St. Martin’s Press.

Tags: AI, AR, VR