Home » 2022 » Chaos informacyjny – czy w świecie SI i big data zostaniemy zasypani nic nieznaczącymi, bądź niezrozumiałymi danymi

Tagi

Wyróżnione posty

Zobacz też

Statystyki

  • 71
  • 238
  • 23 583
  • 6 652
  • 31

Chaos informacyjny – czy w świecie SI i big data zostaniemy zasypani nic nieznaczącymi, bądź niezrozumiałymi danymi

Spread the love

W czasach Data Science oraz Sztucznej Inteligencji, dane oraz ich struktury bez wątpienia odgrywają najistotniejszą rolę. Są one praktycznie wszechobecne w dobie Internetu, dotyczą wielu różnych dziedzin problemów, a ich przetwarzanie pozwala m. in. producentom na łatwiejsze spełnianie potrzeb konsumentów. Jednakże, czy utrzymujący się napływ danych oraz często dokonywane w nich zmiany, mogą również stanowić zagrożenie swoistego nieporządku w Sieci?

Skąd się biorą informacje?

Dzięki powszechnemu dostępowi do internetu każdy może tworzyć, udostępniać nowe informacje, w przeciwieństwie do czasów sprzed powstania globalnej sieci komputerów gdzie dane mogły być przekazywane do informacji publicznej przez tradycyjne media takie jak telewizja, gazety i radio. Jednak w tych formach przekazu występowało wstępne filtrowanie wiadomości, więc nie wszystkie wydarzenia zostawały ukazywane.

Wróćmy jednak do tego co dzieję się aktualnie, każdy z Nas może dodawać treści, które nie wymagają żadnej weryfikacji. Należałoby sprawdzić jaki ma to wpływ na ilość informacji które do Nas docierają.

Data production worldwide from 2010 to 2025

(Źródło: https://www.statista.com/statistics/871513/worldwide-data-created/)

Zgodnie z powyższymi źródłami od lat zauważamy wzrost ilości danych, na dodatek prognozy pokazują że informacji będzie jeszcze więcej. W przeciągu zaledwie 15 lat ma nastąpić ponad 90-krotny wzrost ilości produkowanych danych. Może powinniśmy zacząć od początku, co to jest ten opisany Zetabajt, ile tak naprawdę informacji może on zawierać, czy rzeczywiście powinniśmy się bać. 

1 Zetabajt (ZB) = 1 000 000 000 Terabajtów (TB) = 1 000 000 000 000 (GB)

Przekładając to dodatkowo na informacje z którymi spotykamy się na co dzień:

1 Zetabajt (ZB) = 588 235 294 117 647 Zdjęć

1 Zetabajt (ZB) = 7 490 636 704 119 850 187 Wiadomości tekstowych

1 Zetabajt (ZB) = 12 500 000 000 000 Godzin wideo = 1 426 940 639 Lat wideo

Jest to ogromny przeskok, biorąc pod uwagę że nikt nie byłby w stanie przeglądnąć, przeczytać czy obejrzeć tak wielkiej ilości danych. Budzi się za to pytanie skąd te dane się biorą, przecież nie pojawiają się same z siebie.

Pie chart that present what happens in one minute in internet

 

 

W tym zagadnieniu mogą pomóc szacunki tego co dzieję się na platformach społecznościowych. W ciągu jednej minuty pojawia się ilość treści która może przytłoczyć każdego, spójrzmy na przykład na platformę Youtube, gdzie w 60 sekund pojawia się około 20 dni materiału wideo, a jest to tylko jedno z odwiedzanych przez Nas mediów. 

Niestety liczby są dla Nas, ludzkości, bezlitosne, ilość informacji która otacza każdego z Nas może okazać się przytłaczająca, ale czy na pewno…

Jakość otaczających Nas informacji?

Cały wcześniejszy rozdział miał na celu pokazać Nam z czym wiąże się powszechny dostęp do Internetu. Masowa produkcja informacji, bez żadnej weryfikacji, na które jesteśmy narażeni na praktycznie każdym kroku, nie zapowiada nic pozytywnego. Internet który umożliwia bezpłatny dostęp do praktycznie każdej informacji traci ten najważniejszy atut.

Warto jednak przyjrzeć się co tak naprawdę stoi za tak wielkimi liczbami, a tutaj czeka na Nas kolejne zaskoczenie ponieważ według szacunków aż 90% danych to kopie, więc jedynie 10% to informacje unikatowe. Ta statystyka pozwala nam spać trochę spokojniej, dodatkowo prognozy sugerują że w przyszłości danych powielanych będzie jeszcze więcej.

Kolejnym aspektem o którym trzeba wspomnieć jest dostępność informacji, a tak dokładniej język w którym treści są tworzone. Bariera językowa stanowi poważny problem, może i dostęp do sieci jest powszechny, ale problem może stanowić ilość rozumianych przez użytkowników treści. Statystyki pokazują że 80% dostępnych online treści jest stworzona w 10% dostępnych na świecie języków. Pokazuje to jak duży jest potencjał do dalszego rozwoju Internetu i wzrostu liczby użytkowników. Według prognoz do 2030 roku 90% populacji będzie korzystało z zasobów sieci. 

Te statystki pokazują że może te wielkie liczby, które mogą siać chaos, trzeba brać z dużo dozą niepewności. Jednak potencjał do ich wzrostu, jest cały czas obecny.

Chaos informacyjny – trudności związane z natłokiem informacji

W związku ze swoistym bałaganem, powstającym w wyniku gromadzenia się dużych ilości trywialnych, niepotrzebnych oraz nieustrukturyzowanych danych, przyjęto nazywać niniejszy stan rzeczy “chaosem informacyjnym”. W biznesie mówi się, że jest to sytuacja, w której (ironicznie) występuje jednocześnie za dużo oraz za mało istotnych informacji do przetworzenia. Może pojawić się w momencie, gdy wystąpią dwie wykluczające się potrzeby, niemożliwe do spełnienia jednocześnie. O obecności omawianego zjawiska mogą świadczyć np. spadek jakości usług firmy lub nagłe nieumiejętne zarządzanie zasobami.

(Źródło: https://theecmconsultant.com/what-is-information-chaos/)

Zasadniczo, chaos informacyjny bywa skutkiem nieodpowiedniego podejścia do zarządzania danymi, tj. braku integralności między systemami, niemożliwości udostępniania danych lub niezapewnienia bezpieczeństwa dla danych “wrażliwych”. Niestety, w dzisiejszych czasach, dostosowywanie swoistej polityki zarządzania informacjami okazuje się być jednym z najcięższych wyzwań dla przedsiębiorców, a to dlatego, iż wraz z rozwojem technologii, dane napływają coraz szybciej i w większych ilościach, tym samym przytłaczając użytkowników. Także, samo zarządzanie nimi wiąże się ze względnie wysokimi kosztami. Należy również zaznaczyć, że nieodpowiednia organizacja zebranych informacji generuje wysokie prawdopodobieństwo podejmowania złych decyzji biznesowych, co jest niekorzystne zarówno dla firm, których reputacja może ucierpieć, jak i konsumentów, którzy mogliby zostać wprowadzeni w błąd. Dlatego, optymalizacja sposobu na przetwarzanie istotnych danych jest niezwykle ważna i powinna być zrealizowana jak najszybciej.

Warto także wspomnieć, iż wraz wysokim priorytetem omawianego zjawiska, w pewnym sensie zaburzona jest tym samym konkurencja między przedsiębiorstwami na rynku. Przez konieczność uporania się z “problemami wewnętrznymi”, firmy nie mają jak się skupić na wyróżnianiu się w oczach konsumentów. Z drugiej strony, chaos informacyjny generuje okazje dla przedsiębiorców pod kątem tego, który z nich poradzi sobie z zarządzaniem danych lepiej. Autor artykułu pt. “The Wild West of Managing Unstructured Data Chaos” nazwał niniejszą sytuację “erą Dzikiego Zachodu”, w której szeryfowie, tj. firmy, walczą o to, który z nich skuteczniej “poskromi bestię”, tj. omawiany chaos informacyjny.

Chaos informacyjny jest jak wybuch pandemii

Autor artykułu pt. “You Can Run, But You Can’t Hide From Information Chaos: What COVID-19 Taught Us About Data Management”, napisanego w ramach strony dryvIQ, przyrównał omawiane zjawisko do okresu wybuchu pandemii koronawirusa. Mianowicie, był to czas, w którym masa przedsiębiorstw była zmuszona do nagłego przeniesienia się na pracę zdalną, przy czym badania AIIM wykazały, że zaledwie jedna trzecia z nich tak naprawdę była przygotowana na taką ewentualność. Oznacza to, iż wszystkie pozostałe organizacje, które nie miały optymalnego planu zarządzania firmą w sytuacjach wyjątkowych, musiały poświęcić o wiele więcej czasu na dostosowanie się do panującej sytuacji i tym samym – straciły na produktywności. Wyniki analizy AIIM przedstawiono poniżej.

 

(Źródło: https://dryviq.com/information-chaos-covid19/)

Po tym wszystkim, więcej przedsiębiorstw wzięło “do serca” błędy popełnione w przeszłości, żeby następnym razem być gotowym na podobną ewentualność.

Autor zaznacza, iż podobne skutki może nieść ze sobą właśnie nagły przyrost ilości różnych, nieustrukturyzowanych informacji. Dlatego, zachęca czytelników do w miarę wczesnego dostosowania własnej polityki zarządzania danymi, żeby nie zostali nimi przytłoczeni w nieodpowiednim momencie.

Jak można sobie poradzić z chaosem informacyjnym?

Najprościej można powiedzieć, że proces minimalizacji skutków chaosu informacyjnego sprowadza się do swoistego pozbycia się problemu “u źródła”, tj. dostosowania odpowiedniej strategii zarządzania informacjami. Mówi się, że takie podejście może znacząco zapewnić skuteczniejszą eksploatację zasobów, organizację przechowywania danych oraz bezpieczeństwo i spójność danych. Mimo iż ustalenie polityki zarządzania informacjami potrafi być momentami niezwykle trudne, to jednak warto chociaż spróbować ustalić sobie bardziej ogólne aspekty takowego planu. Najpowszechniejsze porady często opierają się na identyfikacji kategorii w wiedzy bazowej, do których dane miałyby zostać przydzielone (ma to z założenia ułatwić ich przyszłą kategoryzację), określeniu jednoznacznych reguł nazywania, przechowywania, ochrony oraz udostępniania danych, a także ustalenie konkretnych ról dla specyficznych pracowników, odpowiedzialnych za nadzór informacji z konkretnej dziedziny.

Niestety, jak już wcześniej wspomniano, budowanie optymalnego systemu zarządzania danymi “od zera” potrafi być niezwykle uciążliwe i trudne, zwłaszcza dla firm, przechowujących i operujących na dużych ilościach informacji (nawet kilka terabajtów). Co więcej, z czasem dane ulegają ciągłym zmianom, zatem istnieje ryzyko, że utworzony plan, dostosowany do sytuacji obecnej, może kompletnie zawieść z punktu widzenia długoterminowego. W związku z tym, często zaleca się stosowanie programów, odpowiedzialnych za automatyczną klasyfikację oraz orkiestrację informacji, które z założenia mają wykonywać robotę efektywniej od ludzi. Ostatnimi czasy, całkiem sporo zewnętrznych producentów starało się stworzyć własne systemy, obiecujące efektywną i łatwą organizację napływających zasobów. Do takich oprogramowań należą m. in. StorageMAP, polecany we wcześniej wspomnianym artykule “The Wild West of Managing Unstructured Data Chaos” lub Splunk, “reklamowany” na filmie poniżej. Pozostaje tylko pytanie, jak dobrze rzeczywiście radzą sobie z chaosem informacyjnym?

https://www.youtube.com/watch?v=L7rmf4_9UoE

Czy można wykorzystać chaos informacyjny?

Użytkownicy sieci wchodzą z nią w interakcje na przeróżne sposoby np. przy użyciu różnych urządzeń takich jak komputery czy smartfony, korzystając z różnych platform. Skutkiem tego jest generowanie nieustrukturyzowanych danych, szacuje się że około 80-90% danych jest w takiej formie. Dla ludzi takie informacje są raczej nieczytelne, jednak bardzo pomocną mogą być algorytmy Sztucznej Inteligencji oraz Big Data. To one mogą wykorzystać te ilości danych, w zasadzie mogą wykorzystać każdą ilość informacji, im więcej tym lepiej. Według danych z 2021 roku ponad 48% firm w Stanach Zjednoczonych wykorzystuje SI.

Pozostaje jednak pytanie w czym takie algorytmy mogą pomóc, do czego wykorzystuje się takie dane. Najważniejszą funkcją jest wspomaganie decyzji biznesowych, można to osiągnąć na wiele sposobów np. badając nastawienie użytkowników do danej marki, tworząc predykcje donośnie zachowań rynku. Dla wielu branży te decyzje realnie wpływają na wyniki finansowe poszczególnych firm. To wyjaśnia zainteresowanie Sztuczną Inteligencją w dzisiejszych czasach. Najczęściej te rozwiązania stosują firmy zajmujące się Bankowością, Ubezpieczeniami oraz Telekomunikacja.

To właśnie te z pozoru nieistotne i nieczytelne dane stworzone przez chaos informacyjny, są poniekąd inkubatorem algorytmów i rozwiązań Sztucznej Inteligencji oraz Big Data. W perspektywie następnych lat specjaliści wskazują na potrzebę rozwoju narzędzi które pozwolą te dane zbierać oraz strukturyzować, gdyż takie dane będą bardzo wartościowe.

Podsumowanie

Wraz z postępem czasu, ilość danych w Sieci będzie się zwiększała z coraz większą intensywnością i nie będzie można tego zatrzymać. Tak dużo informacji z pewnością będzie stanowiło swoiste zagrożenie dla przedsiębiorstw, a nawet zwykłych użytkowników, którzy mogą mieć trudności z adaptacją. Mimo wszystko, teoria chaosu zakłada, że wśród tej rzekomej losowości danych wciąż istnieją pewne ukryte, ale na swój sposób uporządkowane wzorce, a programiści od dłuższego czasu pracują nad tworzeniem programów, które byłyby w stanie je odnaleźć i jakoś ten chaos uporządkować. Można uznać, że póki firmy opierają się o solidny system zarządzania informacjami, to nadal mogą skutecznie bronić się przed negatywnymi skutkami tego fenomenu. A z czasem, kto wie? Może uda się wykorzystać ten chaos to czegoś pożytecznego na większą skalę.

Bibliografia

https://datadobi.com/blog/the-wild-west-of-managing-unstructured-data-chaos/

https://theecmconsultant.com/what-is-information-chaos/

https://www.mparticle.com/blog/data-chaos

https://dryviq.com/information-chaos-covid19/

https://www.soprasteria.co.uk/thinking/blogs/details/information-chaos-the-next-big-business-challenge

https://seedscientific.com/how-much-data-is-created-every-day/

https://firstsiteguide.com/big-data-stats/

https://www.aparavi.com/resources-blog/data-chaos-information-insight

https://en.wikipedia.org/wiki/Chaos_theory


Leave a comment

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Najnowsze komentarze

  1. Ciekawe jest porównanie tradycyjnej terapii z nowymi rozwiązaniami opartymi na modelach językowych. Warto zauważyć, że mimo obiecujących wyników, istnieją ważne…