{"id":3660,"date":"2023-05-25T00:00:40","date_gmt":"2023-05-25T00:00:40","guid":{"rendered":"http:\/\/architeles.eu\/ethics\/?p=3660"},"modified":"2023-05-29T14:51:09","modified_gmt":"2023-05-29T14:51:09","slug":"kodeks-honorowy-data-scientistow-jak-chronic-dane-bezpiecznie-analizowac-a-ktorych-danych-nie-ruszac","status":"publish","type":"post","link":"https:\/\/architeles.eu\/ethics\/index.php\/2023\/05\/25\/kodeks-honorowy-data-scientistow-jak-chronic-dane-bezpiecznie-analizowac-a-ktorych-danych-nie-ruszac\/","title":{"rendered":"Kodeks honorowy data scientist\u00f3w &#8211; jak chroni\u0107 dane, bezpiecznie analizowa\u0107, a kt\u00f3rych danych nie rusza\u0107."},"content":{"rendered":"<p style=\"text-align: center\"><img decoding=\"async\" class=\"wp-image-3673 aligncenter\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/0x0.webp\" alt=\"\" width=\"928\" height=\"522\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/0x0.webp 1200w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/0x0-300x169.webp 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/0x0-1024x576.webp 1024w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/0x0-768x432.webp 768w\" sizes=\"(max-width: 928px) 100vw, 928px\" \/><em><span style=\"font-size: 10pt\">\u017ar\u00f3d\u0142o: <a href=\"https:\/\/www.forbes.com\/sites\/forbestechcouncil\/2020\/11\/09\/how-to-keep-your-data-secure-in-the-cloud\/\">https:\/\/www.forbes.com\/sites\/forbestechcouncil\/2020\/11\/09\/how-to-keep-your-data-secure-in-the-cloud\/<\/a><\/span><\/em><\/p>\n<p style=\"text-align: justify\">Etyka i sztuczna inteligencja to dwa terminy, kt\u00f3re w coraz wi\u0119kszym stopniu przecinaj\u0105 si\u0119 w rozmowach i debatach na temat przysz\u0142o\u015bci technologii. Szczeg\u00f3lnie wa\u017cna staje si\u0119 ta kwestia w kontek\u015bcie roli jak\u0105 odgrywaj\u0105 specjali\u015bci od danych, czyli Data Scientist, w procesie tworzenia i wdra\u017cania rozwi\u0105za\u0144 opartych na AI. W tej roli przestrzeganie pewnego <strong>kodeksu honorowego<\/strong> ma kluczowe znaczenie. W tym artykule przyjrzymy si\u0119, jakie zasady powinien przestrzega\u0107 Data Scientist, aby chroni\u0107 dane, bezpiecznie je analizowa\u0107, a jednocze\u015bnie rozpoznawa\u0107 te, kt\u00f3rych nie powinno si\u0119 przetwarza\u0107.<\/p>\n<p><!--more--><\/p>\n<h2 style=\"text-align: justify\">Rola etyki w pracy Data Scientista<\/h2>\n<h3 style=\"text-align: justify\">Data Scientist jako stra\u017cnik danych<\/h3>\n<p style=\"text-align: justify\">Maj\u0105c na wzgl\u0119dzie specyfik\u0119 pracy specjalisty od danych na stanowisku Data Scientist, mo\u017cna z du\u017c\u0105 doz\u0105 pewno\u015bci stwierdzi\u0107, i\u017c pe\u0142ni on dodatkow\u0105 rol\u0119 <strong>stra\u017cnika danych<\/strong>, pracuj\u0105c z obecnie jednym z najcenniejszych zasob\u00f3w w organizacjach. Etyka odgrywa istotn\u0105 rol\u0119 w zakresie uzyskania intuicji, w jaki spos\u00f3b przetwarza\u0107 dane, aby nie dopuszcza\u0107 do narusze\u0144, mog\u0105cych by\u0107 krzywdz\u0105cymi dla jednostek b\u0105d\u017a wi\u0119kszych grup u\u017cytkownik\u00f3w. Etyczne przetwarzanie danych ma na celu przede wszystkim <strong>ochron\u0119 prywatno\u015bci i poufnych informacji<\/strong> &#8211; dane medyczne b\u0105d\u017a dane finansowe. Ponadto, nieetyczne oraz niestaranne przetwarzanie danych mo\u017ce prowadzi\u0107 do <strong>nier\u00f3wno\u015bci b\u0105d\u017a dyskryminacji<\/strong> system\u00f3w na nich bazuj\u0105cych. Data Scientist musi dzia\u0142a\u0107 w spos\u00f3b sprawiedliwy i dba\u0107 o to, aby procesy analizy danych a tak\u017ce finalne decyzje podejmowane przez systemy SI by\u0142y <strong>wolne od uprzedze\u0144 czy stronniczo\u015bci. <\/strong>Przestrzeganie norm i zasad etycznych pozwala bowiem budowa\u0107 rozwi\u0105zania mog\u0105ce uzyska\u0107 wiarygodno\u015b\u0107 i zaufanie u\u017cytkownik\u00f3w, brak podejrze\u0144 b\u0105d\u017a zarzut\u00f3w co do manipulacji danymi. W tym zakresie, Data Scientist jako stra\u017cnik danych ponosi spo\u0142eczn\u0105 odpowiedzialno\u015b\u0107 za proces.<\/p>\n<h2 style=\"text-align: justify\">Data Governance<\/h2>\n<p style=\"text-align: center\"><img decoding=\"async\" class=\"aligncenter\" src=\"https:\/\/forum.huawei.com\/enterprise\/en\/data\/attachment\/forum\/202203\/15\/114022dp2nbkmkfdtg1zpq.png\" alt=\"What is data governance and how to choose the best model?\" width=\"787\" height=\"443\" \/><em><span style=\"font-size: 10pt\">\u017ar\u00f3d\u0142o: <a href=\"https:\/\/www.spiceworks.com\/tech\/big-data\/articles\/best-data-governance-tools\/\">https:\/\/www.spiceworks.com\/tech\/big-data\/articles\/best-data-governance-tools\/<\/a><\/span><\/em><\/p>\n<p style=\"text-align: justify\">Data governance to zbi\u00f3r zasad, polityk, procedur i rekomendowanych praktyk dotycz\u0105cych sposob\u00f3w zarz\u0105dzania danymi w organizacji [1]. W uproszczeniu, obejmuje ono zazwyczaj d\u0142ugoterminow\u0105 strategi\u0119, struktur\u0119 organizacyjn\u0105, procesy i mechanizmy, kt\u00f3re maj\u0105 na celu zapewnienie odpowiedniego gromadzenia, zarz\u0105dzania, ochrony i wykorzystywania danych w spos\u00f3b zgodny z przepisami i celami biznesowymi. Zbi\u00f3r tych praktyk, je\u015bli zdefiniowany w organizacji, powinien niejako stanowi\u0107 naturalne \u017ar\u00f3d\u0142o informacji, celem rozwiania w\u0105tpliwo\u015bci w zakresie etyki wykorzystania danych. Istotnym komponentem Data Governance, jest ustalenie <strong>struktury organizacyjnej<\/strong> i <strong>hierarchii\/kultury odpowiedzialno\u015bci<\/strong> za zarz\u0105dzanie danymi, gdzie stanowisko <strong>Data Scientist<\/strong> stanowi kluczow\u0105 rol\u0119. \u00a0Od strony praktycznej, w rol\u0119 komponent\u00f3w zalicza si\u0119 definiowanie standard\u00f3w jako\u015bciowych i zasad transformacji danych, okre\u015blanie zasad bezpiecze\u0144stwa i ochrony danych a tak\u017ce monitorowanie i audyt dzia\u0142a\u0144 zwi\u0105zanych z danymi. Niestety, w wielu organizacja Data Governance nadal uchodzi za proses silnie poboczny, ma\u0142o atrakcyjny, wobec tego indywidualna \u015bwiadomo\u015b\u0107 i dobre praktyki stosowane przez specjalist\u00f3w w dziedzinie przyczyniaj\u0105 si\u0119 w zakresie zdefiniowania kodeksu honorowego.<\/p>\n<h2 style=\"text-align: justify\">Bezpieczne przetwarzanie i analiza danych<\/h2>\n<p style=\"text-align: justify\">Bezpieczne przetwarzanie danych, kt\u00f3re stanowi kluczowy element ochrony prywatno\u015bci i bezpiecze\u0144stwa informacji, opiera si\u0119 na r\u00f3\u017cnorodnych zasadach i wytycznych okre\u015blonych mi\u0119dzy innymi przez Rozporz\u0105dzenie Og\u00f3lne o Ochronie Danych Osobowych (RODO). W sytuacji, gdy w organizacji nie jest zdefiniowana polityka Data Governance, regulacje prawne staj\u0105 si\u0119 punktem odniesienia g\u0142\u00f3wnie w zakresie bezpiecze\u0144stwa pozyskiwania i przetwarzania danych. Kodeks honorowy Data Scientist\u00f3w powinien bezw\u0105tpienia uwzgl\u0119dnia\u0107 nast\u0119puj\u0105ce zasady [4]:<\/p>\n<ol style=\"text-align: justify\">\n<li><strong>Zasada zgodno\u015bci z prawem, przejrzysto\u015bci i rzetelno\u015bci:<\/strong> Osoby, kt\u00f3rych dane s\u0105 przetwarzane, powinny by\u0107 poinformowane o celach, zakresie i sposobach przetwarzania ich danych osobowych. Informacje te powinny by\u0107 \u0142atwo dost\u0119pne i zrozumia\u0142e.<\/li>\n<li><strong>Zasada ograniczenia celu<\/strong>: Dane osobowe powinny by\u0107 zbierane i przetwarzane tylko w celach okre\u015blonych, jasno zdefiniowanych i zgodnych z prawem. Przetwarzanie danych powinno odbywa\u0107 si\u0119 tylko w celu, dla kt\u00f3rego zosta\u0142y zebrane.<\/li>\n<li><strong>Zasada minimalizacji danych<\/strong>: Przetwarzanie danych powinno by\u0107 ograniczone do minimum niezb\u0119dnego do osi\u0105gni\u0119cia okre\u015blonego celu. Nie nale\u017cy zbiera\u0107 ani przechowywa\u0107 zb\u0119dnych danych.<\/li>\n<li><strong>Zasada prawid\u0142owo\u015bci danych<\/strong>: Dane osobowe powinny by\u0107 dok\u0142adne, kompleksowe i aktualne. Nale\u017cy podj\u0105\u0107 odpowiednie \u015brodki, aby zapewni\u0107, \u017ce przechowywane dane s\u0105 poprawne i aktualne.<\/li>\n<li><strong>Zasada ograniczenia przechowywania danych<\/strong>: Dane osobowe powinny by\u0107 przechowywane tylko przez okres niezb\u0119dny do osi\u0105gni\u0119cia celu przetwarzania. Po up\u0142ywie tego okresu dane powinny by\u0107 usuni\u0119te lub zanonimizowane.<\/li>\n<li><strong>Zasada integralno\u015bci i poufno\u015bci danych<\/strong>: Nale\u017cy podj\u0105\u0107 odpowiednie \u015brodki techniczne i organizacyjne, aby zapewni\u0107 bezpiecze\u0144stwo danych i ochron\u0119 przed nieautoryzowanym dost\u0119pem, utrat\u0105, uszkodzeniem lub nieuprawnionym ujawnieniem. Dost\u0119p do danych powinien by\u0107 ograniczony tylko do upowa\u017cnionych os\u00f3b.<\/li>\n<li><strong>Zasada rozliczalno\u015bci<\/strong>: Podmiot przetwarzaj\u0105cy dane osobowe powinien ponosi\u0107 odpowiedzialno\u015b\u0107 za przestrzeganie zasad ochrony danych i podejmowa\u0107 odpowiednie \u015brodki, aby zapewni\u0107 ich przestrzeganie. Nale\u017cy przeprowadza\u0107 regularne audyty i monitorowa\u0107 zgodno\u015b\u0107 z przepisami dotycz\u0105cymi ochrony danych.<\/li>\n<\/ol>\n<h2>Techniki bezpiecznego przetwarzania danych<\/h2>\n<p style=\"text-align: justify\">\u015awiadomo\u015b\u0107 bezpiecznego przetwarzania danych stanowi teoretyczn\u0105 podstaw\u0119 kodeksu honorowego. Jednak\u017ce, istnieje szereg technik maj\u0105cych praktyczne zastosowanie w zgodzie z uprzednio zdefiniowanymi zasadami. W obszarach takich jak Data Science wykorzystywanie danych do wyci\u0105gania warto\u015bciowych wniosk\u00f3w i tworzenia innowacyjnych rozwi\u0105za\u0144 staje si\u0119 nieod\u0142\u0105czn\u0105 cz\u0119\u015bci\u0105 strategii sukcesu. Jednak\u017ce, wraz z rosn\u0105c\u0105 ilo\u015bci\u0105 danych, pojawiaj\u0105 si\u0119 r\u00f3wnie\u017c nowe wyzwania zwi\u0105zane mi\u0119dzy innymi z ochron\u0105 prywatno\u015bci, bezpiecze\u0144stwem informacji oraz przestrzeganiem odpowiednich przepis\u00f3w i regulacji. W tym kontek\u015bcie, techniki bezpiecznego przetwarzania danych nabieraj\u0105 szczeg\u00f3lnego znaczenia. Istnieje coraz wi\u0119ksze zapotrzebowanie na innowacyjne metody, kt\u00f3re nie tylko umo\u017cliwiaj\u0105 efektywne wykorzystanie danych, ale tak\u017ce gwarantuj\u0105, \u017ce prywatno\u015b\u0107 u\u017cytkownik\u00f3w i poufno\u015b\u0107 informacji s\u0105 w pe\u0142ni chronione.<\/p>\n<p style=\"text-align: justify\">Jedn\u0105 z powszechnie stosowanych technik, kt\u00f3re ciesz\u0105 si\u0119 rosn\u0105cym zainteresowaniem, jest <strong>uczenie federacyjne<\/strong>. Ta innowacyjna metoda pozwala na trenowanie modeli na rozproszonych zbiorach danych, bez konieczno\u015bci przekazywania samych danych do centralnego serwera. W ramach uczenia federacyjnego modele s\u0105 wysy\u0142ane do lokalnych \u017ar\u00f3de\u0142 danych, gdzie ucz\u0105 si\u0119 na swoich w\u0142asnych zbiorach informacji. Nast\u0119pnie, zaktualizowane modele s\u0105 przekazywane do centralnego serwera, kt\u00f3ry agreguje te modele i tworzy globalny model. Dzi\u0119ki temu podej\u015bciu dane pozostaj\u0105 na swoim pierwotnym miejscu, minimalizuj\u0105c ryzyko nieuprawnionego dost\u0119pu i naruszenia prywatno\u015bci.<\/p>\n<p style=\"text-align: justify\">Inn\u0105 z powszechnie wykorzystywanych metod, kt\u00f3re mo\u017cna zastosowa\u0107 w celu zabezpieczenia danych, jest <strong>anonimizacja danych<\/strong>. Anonimizacja danych to proces przekszta\u0142cenia danych osobowych w spos\u00f3b uniemo\u017cliwiaj\u0105cy przyporz\u0105dkowanie poszczeg\u00f3lnych informacji do okre\u015blonej lub mo\u017cliwej do zidentyfikowania osoby fizycznej. Anonimizacja jest procesem, kt\u00f3ry umo\u017cliwia trwa\u0142e roz\u0142\u0105czenie danych osobowych z konkretn\u0105 osob\u0105, do kt\u00f3rej si\u0119 odnosz\u0105 [5]. Dzi\u0119ki temu, dane, kt\u00f3re wcze\u015bniej by\u0142y uwa\u017cane za dane osobowe, trac\u0105 t\u0119 cech\u0119 i staj\u0105 si\u0119 ca\u0142kowicie niepowi\u0105zanymi zidentyfikowanymi informacjami. Istnieje szereg r\u00f3\u017cnych metod anonimizacji danych, takich jak generalizacja, randomizacja czy agregacja danych.<\/p>\n<p style=\"text-align: justify\"><strong>Szyfrowanie<\/strong> jest kolejn\u0105 z technik, kt\u00f3ra mo\u017ce by\u0107 stosowana do ochrony danych podczas przechowywania, przesy\u0142ania i przetwarzania. Polega na przekszta\u0142ceniu czytelnych danych w format nieczytelny i niezrozumia\u0142y dla os\u00f3b nieupowa\u017cnionych. Proces szyfrowania wykorzystuje specjalne algorytmy i klucze, kt\u00f3re zmieniaj\u0105 dane w posta\u0107 zaszyfrowan\u0105. Tylko osoby posiadaj\u0105ce odpowiedni klucz mog\u0105 odczyta\u0107 dane i przywr\u00f3ci\u0107 je do pierwotnej formy. Szyfrowanie zapewnia nie tylko poufno\u015b\u0107 danych, ale tak\u017ce ochron\u0119 przed nieautoryzowanym dost\u0119pem, kradzie\u017c\u0105 danych i nadu\u017cyciami. Maj\u0105c na wzgl\u0119dzie kryptografie, nale\u017cy zadba\u0107 o bezpieczny proces wymiany oraz pozyskiwania kluczy szyfruj\u0105cych.<\/p>\n<p style=\"text-align: center\"><img decoding=\"async\" class=\"wp-image-3770 aligncenter\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/avs.webp\" alt=\"\" width=\"850\" height=\"421\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/avs.webp 1440w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/avs-300x149.webp 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/avs-1024x508.webp 1024w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2023\/05\/avs-768x381.webp 768w\" sizes=\"(max-width: 850px) 100vw, 850px\" \/><span style=\"font-size: 10pt\"><em> R\u00f3\u017cnica mi\u0119dzy maskowaniem a szyfrowaniem danych (\u017ar\u00f3d\u0142o: <a href=\"https:\/\/www.k2view.com\/blog\/data-masking-vs-encryption\">https:\/\/www.k2view.com\/blog\/data-masking-vs-encryption<\/a>)<\/em><\/span><\/p>\n<p style=\"text-align: justify\">W systemach ochrony danych istniej\u0105 trzy kluczowe elementy, kt\u00f3re s\u0105 wzajemnie powi\u0105zane i odgrywaj\u0105 istotn\u0105 rol\u0119. S\u0105 nimi <strong>uwierzytelnianie<\/strong>, <strong>autoryzacja<\/strong> i <strong>kontrola dost\u0119pu<\/strong>, cz\u0119sto oznaczane skr\u00f3tem <strong>AAA<\/strong> z angielskich s\u0142\u00f3w: <span id=\"tresc\"><em><strong>Authentication<\/strong><\/em>, <em><strong>Authorization<\/strong><\/em> i <em><strong>Accounting <\/strong><\/em>[6].<\/span><\/p>\n<p style=\"text-align: justify\">Uwierzytelnianie odnosi si\u0119 do procesu weryfikacji to\u017csamo\u015bci u\u017cytkownika lub systemu, kt\u00f3ry chce uzyska\u0107 dost\u0119p do okre\u015blonych zasob\u00f3w. W tym procesie u\u017cytkownik dostarcza dane uwierzytelniaj\u0105ce, takie jak login i has\u0142o, karta dost\u0119pu, odcisk palca lub inne czynniki, kt\u00f3re pozwalaj\u0105 potwierdzi\u0107, \u017ce dana osoba jest tym, za kogo si\u0119 podaje.<\/p>\n<p style=\"text-align: justify\">Autoryzacja jest kolejnym krokiem po uwierzytelnianiu. Polega na przyznawaniu uprawnie\u0144 lub dost\u0119pu do okre\u015blonych zasob\u00f3w lub funkcjonalno\u015bci w systemie w oparciu o zdefiniowane regu\u0142y. Autoryzacja okre\u015bla, jakie czynno\u015bci u\u017cytkownik mo\u017ce wykona\u0107 po pomy\u015blnym uwierzytelnieniu. Mo\u017ce obejmowa\u0107 zezwolenie na odczyt, zapis, modyfikacj\u0119 lub usuwanie danych, dost\u0119p do okre\u015blonych funkcji aplikacji lub dost\u0119p do specyficznych obszar\u00f3w systemu.<\/p>\n<p style=\"text-align: justify\">Kontrola dost\u0119pu to proces zarz\u0105dzania dost\u0119pem do zasob\u00f3w systemu. Obejmuje zarz\u0105dzanie uprawnieniami u\u017cytkownik\u00f3w lub r\u00f3l, tworzenie regu\u0142 i polityk, kt\u00f3re okre\u015blaj\u0105, kto ma dost\u0119p do okre\u015blonych zasob\u00f3w, jakie czynno\u015bci mog\u0105 by\u0107 podejmowane, oraz jakie warunki musz\u0105 by\u0107 spe\u0142nione. Kontrola dost\u0119pu pozwala na monitorowanie, ograniczanie i rejestrowanie dzia\u0142a\u0144 u\u017cytkownik\u00f3w w systemie w celu zapewnienia bezpiecze\u0144stwa i ochrony danych. Wobec tego, kodeks honorowy Data Scientist\u00f3w powinien zawiera\u0107 dobre praktyki wytwarzania oprogramowania, w zakresie projektowania rozwi\u0105za\u0144 bezpiecznych, dostosowanych do aktualnych norm w zakresie przechowywania danych, w zabezpieczeniu przed ich utrat\u0105 b\u0105d\u017a niepowo\u0142anym dost\u0119pem.<\/p>\n<h2 style=\"text-align: justify\">Kodeks honorowy Data Scientist<\/h2>\n<h3 style=\"text-align: justify\">Zasada pierwsza: Prywatno\u015b\u0107 przede wszystkim<\/h3>\n<p style=\"text-align: justify\">Prywatno\u015b\u0107 to jedna z podstawowych zasad, kt\u00f3re ka\u017cdy Data Scientist powinien przestrzega\u0107. Nale\u017cy wi\u0119c chroni\u0107 dane osobowe, kt\u00f3re s\u0105 nam powierzone, i zawsze uzyska\u0107 zgod\u0119 na ich wykorzystanie. \u0179r\u00f3d\u0142o danych powinno by\u0107 dobrze udokumentowane. Przyk\u0142adem realizacji tej zasady mo\u017ce by\u0107 wykorzystanie technik anonimizacji danych, celem unikni\u0119cia \u0142atwego powi\u0105zania danych z konkretn\u0105 osob\u0105 przez niepo\u017c\u0105dane podmioty. Na tym etapie, koniecznym jest pozostanie w pe\u0142nej zgodno\u015bci z regulacjami takimi jak RODO. Wypracowanie lokalnych b\u0105d\u017a globalnych polityk w tym zakresie, powinno pozwala\u0107 na elastyczne zarz\u0105dzanie danymi, szczeg\u00f3lnie w sytuacji gdy u\u017cytkownicy wystosuj\u0105 pro\u015bb\u0119 o usuni\u0119cie ich danych z bazy.<\/p>\n<h3 style=\"text-align: justify\">Zasada druga: Transparentno\u015b\u0107 w dzia\u0142aniu<\/h3>\n<p style=\"text-align: justify\">Data Scientist powinien zawsze d\u0105\u017cy\u0107 do pe\u0142nej transparentno\u015bci w swojej pracy. To oznacza, \u017ce powinien jasno komunikowa\u0107, jakie dane s\u0105 zbierane, jak s\u0105 przetwarzane i do jakich cel\u00f3w s\u0105 u\u017cywane. Transparentno\u015b\u0107 jest r\u00f3wnie\u017c kluczowa w kontek\u015bcie modeli AI, kt\u00f3re tworzymy. Powinni\u015bmy by\u0107 w stanie wyja\u015bni\u0107, jak nasze modele dzia\u0142aj\u0105 i na jakich danych zosta\u0142y wytrenowane, co jest szczeg\u00f3lnie wa\u017cne w kontek\u015bcie tzw. <strong>czarnych skrzynek<\/strong>, gdzie proces decyzyjny modelu mo\u017ce by\u0107 niejasny. Istotny wp\u0142yw ma XAI czyli eXplainable AI, a wi\u0119c zbi\u00f3r technik pozwalaj\u0105cych na wyja\u015bnienie powodu, dla kt\u00f3rego model podj\u0105\u0142 tak\u0105 a nie inn\u0105 decyzj\u0119. Warto r\u00f3wnie\u017c mie\u0107 na wzgl\u0119dzie, i\u017c zasada ta obejmuje staranny dob\u00f3r narz\u0119dzi \u015bci\u015ble do typu przetwarzanych danych (walidacja krzy\u017cowa dla szereg\u00f3w czasowych).<\/p>\n<h3 style=\"text-align: justify\">Zasada trzecia: Zgodno\u015b\u0107 z dobrymi praktykami wytwarzania oprogramowania<\/h3>\n<p style=\"text-align: justify\">Projektowane aplikacje b\u0105d\u017a serwisy powinny spe\u0142nia\u0107 aktualne normy w zakresie bezpiecze\u0144stwa przechowywanych danych. Istotnym jest wi\u0119c zachowanie zgodno\u015bci co do dobrych praktyk wytwarzania oprogramowania.<\/p>\n<h3 style=\"text-align: justify\">Zasada czwarta: R\u00f3wno\u015b\u0107 i brak dyskryminacji<\/h3>\n<p style=\"text-align: justify\">Data Scientist powinien rozwa\u017ca\u0107 skutki spo\u0142eczne i \u015brodowiskowe swoich dzia\u0142a\u0144. Powinien dzia\u0142a\u0107 w spos\u00f3b, kt\u00f3ry przyczynia si\u0119 do dobra spo\u0142ecze\u0144stwa i \u015brodowiska, unikaj\u0105c szkody czy nadu\u017cy\u0107. Procesy trenowania i utrzymania modeli SI powinny przebiega\u0107 w szczeg\u00f3lnej staranno\u015bci, aby zapobiega\u0107 tworzeniu rozwi\u0105za\u0144, kt\u00f3rych werdykty by\u0142yby w jaki\u015b spos\u00f3b nieprawid\u0142owe, niesprawiedliwe b\u0105d\u017a krzywdz\u0105ce. Data Scientist, powinien dodatkowo stosowa\u0107 czyteln\u0105 i jasno okre\u015blon\u0105 metodologi\u0119 (szczeg\u00f3lnie, uwzgl\u0119dniaj\u0105c\u0105 adaptacje rozwi\u0105za\u0144 AI do danych, kt\u00f3rych charakterystyka\/dystrybucja mo\u017ce ulega\u0107 zmianie) weryfikacji modeli SI, unikaj\u0105c manipulacji wynik\u00f3w czy prezentowania informacji w spos\u00f3b dezinformuj\u0105cy.<\/p>\n<h2 style=\"text-align: justify\">Kiedy nie dotyka\u0107 danych?<\/h2>\n<p style=\"text-align: justify\">Niezale\u017cnie od tego, jak atrakcyjne mog\u0105 wydawa\u0107 si\u0119 dane, istniej\u0105 sytuacje, w kt\u00f3rych Data Scientist powinien odm\u00f3wi\u0107 ich wykorzystania. Do tych sytuacji nale\u017c\u0105:<\/p>\n<ol style=\"text-align: justify\">\n<li><strong>Dane bez zgody<\/strong>: Je\u017celi brakuje wyra\u017anej zgody na przetwarzanie danych, nie powinno si\u0119 ich dotyka\u0107. Zasada ta ma zastosowanie zar\u00f3wno do danych osobowych, jak i do danych z innych \u017ar\u00f3de\u0142. Bez odpowiedniej zgody i prawnej podstawy przetwarzanie danych by\u0142oby naruszeniem prywatno\u015bci i etyki.<\/li>\n<li><strong>Dane wra\u017cliwe<\/strong>: Niekt\u00f3re dane s\u0105 szczeg\u00f3lnie wra\u017cliwe, np. dane dotycz\u0105ce zdrowia, orientacji seksualnej, przekona\u0144 religijnych czy politycznych. Przetwarzanie takich danych bez odpowiednich \u015brodk\u00f3w ochrony mo\u017ce prowadzi\u0107 do powa\u017cnych narusze\u0144 prywatno\u015bci. Data Scientist powinien mie\u0107 \u015bwiadomo\u015b\u0107, \u017ce istniej\u0105 specjalne regulacje i wymagania dotycz\u0105ce przetwarzania tych danych oraz zastosowa\u0107 odpowiednie \u015brodki ochrony, takie jak anonimizacja.<\/li>\n<li><strong>Dane z nielegalnych \u017ar\u00f3de\u0142<\/strong>: Je\u017celi dane pochodz\u0105 z nielegalnych \u017ar\u00f3de\u0142, nie powinno si\u0119 ich u\u017cywa\u0107. Przestrzeganie tej zasady jest kluczowe dla utrzymania wysokich standard\u00f3w etycznych w bran\u017cy Data Science. Korzystanie z nielegalnie pozyskanych danych mo\u017ce prowadzi\u0107 do powa\u017cnych konsekwencji prawnych i narusze\u0144 zasad etycznych.<\/li>\n<\/ol>\n<p style=\"text-align: justify\">Podsumowuj\u0105c, z prac\u0105 Data Scientisty wi\u0105\u017ce si\u0119 du\u017ca odpowiedzialno\u015b\u0107. Przestrzeganie kodeksu honorowego jest nie tylko kwesti\u0105 etyki, ale r\u00f3wnie\u017c kluczem do budowania zaufania do naszej pracy i technologii, kt\u00f3re tworzymy. Istotn\u0105 rol\u0119 odgrywaj\u0105 klarownie zdefiniowane zasady Data Governance w organizacjach, kt\u00f3re niestety cz\u0119sto pozostaj\u0105 drugoplanowe. Wobec tego, pozyskuj\u0105c, przetwarzaj\u0105c b\u0105d\u017a przechowuj\u0105c dane, nale\u017cy mie\u0107 na wzgl\u0119dzie wszelkie obowi\u0105zuj\u0105ce regulacje takie jak RODO.<\/p>\n<h2><strong>Literatura<\/strong><\/h2>\n<ol>\n<li>Data Governance: Organizing data for trustworthy Artificial Intelligence; Marijn Janssen, Paul Brous, Elsa Estevez, Luis S. Barbosa, Tomasz Janowski; https:\/\/doi.org\/10.1016\/j.giq.2020.101493<\/li>\n<li>https:\/\/rkrodo.pl\/minimalizacja-danych-rodo\/<\/li>\n<li>https:\/\/odo24.pl\/rodo-uodo\/zasady-przetwarzania-danych-osobowych\/<\/li>\n<li>https:\/\/www.apexnet.com.pl\/blog\/newsy-prawne\/7-zasad-przetwarzania-danych-wedlug-rodo\/<\/li>\n<li>https:\/\/pl.wikipedia.org\/wiki\/Anonimizacja_danych<\/li>\n<li>https:\/\/www.computerworld.pl\/news\/AAA-uwierzytelnianie-autoryzacja-i-kontrola-dostepu-cz-1,374709.html<\/li>\n<\/ol>\n","protected":false},"excerpt":{"rendered":"<p>\u017ar\u00f3d\u0142o: https:\/\/www.forbes.com\/sites\/forbestechcouncil\/2020\/11\/09\/how-to-keep-your-data-secure-in-the-cloud\/ Etyka i sztuczna inteligencja to dwa terminy, kt\u00f3re w coraz wi\u0119kszym stopniu przecinaj\u0105 si\u0119 w rozmowach i debatach na temat przysz\u0142o\u015bci technologii. Szczeg\u00f3lnie wa\u017cna staje si\u0119 ta kwestia w kontek\u015bcie roli jak\u0105 odgrywaj\u0105 specjali\u015bci od danych, czyli Data Scientist, w procesie tworzenia i wdra\u017cania rozwi\u0105za\u0144 opartych na AI. W tej roli przestrzeganie pewnego [&hellip;]<\/p>\n","protected":false},"author":98,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[225],"tags":[15,75,49,43,12,39],"class_list":["post-3660","post","type-post","status-publish","format-standard","hentry","category-agh-2022-23","tag-ai","tag-bezpieczenstwo","tag-dane","tag-data-science","tag-etyka","tag-przetwarzanie-danych"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/3660","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/users\/98"}],"replies":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/comments?post=3660"}],"version-history":[{"count":17,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/3660\/revisions"}],"predecessor-version":[{"id":3795,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/3660\/revisions\/3795"}],"wp:attachment":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/media?parent=3660"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/categories?post=3660"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/tags?post=3660"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}