{"id":1260,"date":"2022-05-12T08:57:36","date_gmt":"2022-05-12T08:57:36","guid":{"rendered":"http:\/\/architeles.pl\/ethics\/?p=1260"},"modified":"2022-05-12T09:02:24","modified_gmt":"2022-05-12T09:02:24","slug":"open-source-czy-oprogramowania-zamkniete-czy-techniki-i-narzedzia-si-i-data-science-powinny-byc-w-otwartym-dostepie-za-i-przeciw","status":"publish","type":"post","link":"https:\/\/architeles.eu\/ethics\/index.php\/2022\/05\/12\/open-source-czy-oprogramowania-zamkniete-czy-techniki-i-narzedzia-si-i-data-science-powinny-byc-w-otwartym-dostepie-za-i-przeciw\/","title":{"rendered":"Open-source czy oprogramowania zamkni\u0119te. Czy techniki i narz\u0119dzia SI i Data Science powinny by\u0107 w otwartym dost\u0119pie &#8211; za i przeciw"},"content":{"rendered":"<p><strong>Codziennie stajemy si\u0119 u\u017cytkownikami niezliczonych serwis\u00f3w i oprogramowania, w tym coraz cz\u0119\u015bciej takiego, kt\u00f3re zawiera w sobie elementy rozwi\u0105za\u0144 SI oraz Data Science. Bankowo\u015b\u0107 elektroniczna, serwisy spo\u0142eczno\u015bciowe, a nawet i ju\u017c\u00a0dosy\u0107 powszechnie analiza wynik\u00f3w bada\u0144 lekarskich, to miejsca, w kt\u00f3rych sztuczna inteligencja zaczyna odgrywa\u0107 coraz to bardziej znacz\u0105c\u0105\u00a0rol\u0119. W zwi\u0105zku z powszechno\u015bci\u0105\u00a0powy\u017cszych rozwi\u0105za\u0144, jak i ich wp\u0142ywu na du\u017c\u0105\u00a0liczb\u0119\u00a0aspekt\u00f3w naszego \u017cycia, pojawia si\u0119 pytanie: czy rozwi\u0105zania SI i Data Science powinny by\u0107 w otwartym dost\u0119pie, czy mo\u017ce ich dalszy kierunek rozwoju powinien by\u0107\u00a0zdefiniowany w ramach oprogramowania zamkni\u0119tego? W tym wpisie chcemy rozwa\u017cy\u0107\u00a0zalety i wady obu podej\u015b\u0107.<\/strong><\/p>\n<p><!--more--><\/p>\n<h1><b>Wprowadzenie<\/b><\/h1>\n<p><span style=\"font-weight: 400\">Sztuczna inteligencja i Data Science to ju\u017c\u00a0nie technologie przysz\u0142o\u015bci &#8211; sta\u0142y si\u0119 one powszechnie stosowanym narz\u0119dziami. Przedsi\u0119biorstwa dostrzegaj\u0105, jaki potencja\u0142 biznesowy ma wykorzystanie danych nieustannie zbieranych na temat ich klient\u00f3w i u\u017cytkownik\u00f3w ich us\u0142ug. Politycy swoje kampanie opieraj\u0105\u00a0na starannie opracowanych modelach zachowa\u0144 i preferencji spo\u0142ecze\u0144stwa. R\u00f3wnie\u017c sami klienci oczekuj\u0105, i\u017c to co jest im oferowane, b\u0119dzie jak najbardziej dopasowane do ich upodoba\u0144. To tylko bardzo w\u0105ski wachlarz przyk\u0142ad\u00f3w, gdzie swoje miejsce odnajduj\u0105\u00a0sztuczna inteligencja i techniki Data Science.<\/span><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1268\" src=\"http:\/\/architeles.pl\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600-300x131.jpeg\" alt=\"AI in banking\" width=\"300\" height=\"131\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600-300x131.jpeg 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600-1024x448.jpeg 1024w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600-768x336.jpeg 768w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600-1536x672.jpeg 1536w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/artificial-intelligence-in-banking-main-1600.jpeg 1600w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Rozw\u00f3j dziedziny naukowej jak\u0105\u00a0jest SI skutkuje obfito\u015bci\u0105\u00a0artyku\u0142\u00f3w naukowych, w kt\u00f3rych codziennie proponowane s\u0105 nowe, lepsze modele uczenia maszynowego, kolejne mo\u017cliwo\u015bci zastosowania ju\u017c\u00a0istniej\u0105cych. Nie mniej, nie trzeba mie\u0107\u00a0bardzo specjalistycznej wiedzy, by m\u00f3c u\u017cywa\u0107\u00a0najnowszych osi\u0105gni\u0119\u0107 z zakresu data science. In\u017cynierowie oprogramowania mog\u0105 skorzysta\u0107\u00a0z wachlarzu rozwi\u0105za\u0144 dost\u0119pnych w chmurze, a nawet i osoby bez wykszta\u0142cenia technicznego, mog\u0105\u00a0korzysta\u0107\u00a0z program\u00f3w takich jak Clementine lub Orange, by w \u0142atwy spos\u00f3b stosowa\u0107 narz\u0119dzia AI do swoich danych.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pozostaje jednak wa\u017cny aspekt: kto i na jakiej zasadzie tworzy oprogramowanie opieraj\u0105ce si\u0119\u00a0na SI? Jakie decyzje projektowe podejmowane s\u0105 w kontek\u015bcie algorytm\u00f3w, kt\u00f3rych dzia\u0142anie wp\u0142ywa na ca\u0142e spo\u0142ecze\u0144stwa? Prowadzi to do pytania, czy narz\u0119dzia SI i data science powinny by\u0107 w otwartym dost\u0119pie?<\/span><\/p>\n<p><span style=\"font-weight: 400\">W celu pr\u00f3by znalezienia odpowiedzi na t\u0119 kwesti\u0119, na pocz\u0105tku pragniemy rozwa\u017cy\u0107, czym jest oprogramowanie w otwartym dost\u0119pie, jak r\u00f3\u017cni si\u0119 ono od oprogramowania zamkni\u0119tego oraz jakie s\u0105 dobre i z\u0142e cechy obu podej\u015b\u0107. Kolejno, odniesiemy si\u0119 do tego zagadnienia w kontek\u015bcie narz\u0119dzi SI i Data Science, jak i aktualnego tematu, jakim jest potencjalne upublicznienie algorytmu Twittera. W tym wpisie chcemy poruszy\u0107 tak\u017ce kwesti\u0119 wyja\u015bnialno\u015bci decyzji algorytm\u00f3w uczenia maszynowego, kt\u00f3ra bezpo\u015brednio dotyczy og\u00f3lnego aspektu transparentno\u015bci narz\u0119dzi SI i Data Science.<\/span><\/p>\n<h1><b>Rodzaje oprogramowania<\/b><\/h1>\n<p><span style=\"font-weight: 400\">W pierwszej kolejno\u015bci nale\u017cy zdefiniowa\u0107, czym jest oprogramowanie open source i jak r\u00f3\u017cni si\u0119\u00a0ono od oprogramowania zamkni\u0119tego.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Open-source<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Jest to rodzaj oprogramowania, kt\u00f3rego w\u0142a\u015bciciel praw autorskich, na podstawie licencji, przyznaje u\u017cytkownikom prawa do korzystania, rozpowszechniania oraz wprowadzania zmian. W takim podej\u015bciu udost\u0119pniany jest kod \u017ar\u00f3d\u0142owy danej aplikacji\/programu.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Organizacja Open Source Initiative<\/span><span style=\"font-weight: 400\">\u00a0podaje przyk\u0142ady najpopularniejszych <a href=\"https:\/\/opensource.org\/licenses\">licencji open source<\/a>:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Apache License 2.0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">BSD 3-Clause &#8222;New&#8221; or &#8222;Revised&#8221; license<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">BSD 2-Clause &#8222;Simplified&#8221; or &#8222;FreeBSD&#8221; license<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">GNU General Public License (GPL)<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">GNU Library or &#8222;Lesser&#8221; General Public License (LGPL)<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">MIT license<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Mozilla Public License 2.0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Common Development and Distribution License<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Eclipse Public License version 2.0.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">Najcz\u0119\u015bciej udost\u0119pnienie oprogramowania w ramach open source wi\u0105\u017ce si\u0119\u00a0z dodaniem klauzuli zdefiniowanej przez wybrany rodzaj licencji.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Oprogramowania zamkni\u0119te &#8211; proprietary software<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Jest to oprogramowanie chronione prawem autorskim, ze wzgl\u0119du na kt\u00f3re obj\u0119te jest ono pewnymi restrykcjami dotycz\u0105cymi sposobu u\u017cywania, rozpowszechniania, a tak\u017ce modyfikowania. Na og\u00f3\u0142 rozpowszechniane jest w postaci binarnej &#8211; bez udost\u0119pniania kodu \u017ar\u00f3d\u0142owego. Taki rodzaj oprogramowania pozostaje w\u0142asno\u015bci\u0105 tw\u00f3rcy, natomiast u\u017cytkownicy mog\u0105 z niego korzysta\u0107 na podstawie wcze\u015bniej okre\u015blonych warunk\u00f3w. Najcz\u0119\u015bciej<a href=\"https:\/\/en.wikipedia.org\/wiki\/Proprietary_software\"> takie oprogramowanie zabezpieczane jest<\/a> przy pomocy \u015brodk\u00f3w takich jak klucze licencyjne, sprz\u0119towe, numery seryjne i konieczno\u015b\u0107 aktywacji produktu<\/span><span style=\"font-weight: 400\">. Ponadto tw\u00f3rcy takiego oprogramowania stosuj\u0105\u00a0techniki takie jak obfuskacja kodu, aby uniemo\u017cliwi\u0107\u00a0odtworzenie kodu \u017ar\u00f3d\u0142owego przy pomocy dekompilacji. Zamkni\u0119ty typ oprogramowania jest zazwyczaj p\u0142atny, wi\u0105\u017ce si\u0119\u00a0z jednorazow\u0105 op\u0142at\u0105, lub wielokrotn\u0105,\u00a0w modelu subskrypcyjnym.<\/span><\/p>\n<h1><b>Open source vs oprogramowanie zamkni\u0119te<\/b><\/h1>\n<p><iframe loading=\"lazy\" title=\"Open Source vs. Closed Source Software\" width=\"600\" height=\"338\" src=\"https:\/\/www.youtube.com\/embed\/2q91vTvc7YE?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/p>\n<h2><span style=\"font-weight: 400\">Koszty<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Cz\u0119sto mo\u017cna uto\u017csamia\u0107 poj\u0119cie open-source z czym\u015b darmowym, natomiast oprogramowanie zamkni\u0119te, czy te\u017c obj\u0119te prawami autorskimi z czym\u015b za co nale\u017cy zap\u0142aci\u0107. W wi\u0119kszo\u015bci przypadk\u00f3w tak jest, jednak\u017ce nie nale\u017cy uwa\u017ca\u0107 tego za co\u015b pewnego, gdy\u017c wyst\u0119puj\u0105 tak\u017ce odmienne sytuacje &#8211; na przyk\u0142ad wyszukiwarki\u00a0 lub komunikatory, kt\u00f3rych \u017ar\u00f3d\u0142a nie s\u0105 publicznie dost\u0119pne, mog\u0105 by\u0107 darmowe i s\u0142u\u017cy\u0107 jako medium dla znalezienia odbiorc\u00f3w reklam (przyk\u0142adowo <a href=\"https:\/\/www.investopedia.com\/articles\/investing\/020515\/business-google.asp\">wi\u0119kszo\u015b\u0107 przychodu firmy Google w IV kwartale 2021 pochodzi\u0142o z reklam<\/a><\/span><span style=\"font-weight: 400\">). Ponadto takie us\u0142ugi zbieraj\u0105\u00a0dane dotycz\u0105ce ich u\u017cytkownik\u00f3w, kt\u00f3re same w sobie stanowi\u0105 warto\u015b\u0107 dla firm oferuj\u0105cych oprogramowanie zamkni\u0119te, poniewa\u017c dzi\u0119ki nim mog\u0105\u00a0one rozwija\u0107 swoje narz\u0119dzia SI. St\u0105d nie mo\u017cna jednoznacznie uzna\u0107, \u017ce wad\u0105 oprogramowania closed source jest jego cena dla u\u017cytkownika.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Wsparcie techniczne<\/span><\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1265\" src=\"http:\/\/architeles.pl\/ethics\/wp-content\/uploads\/2022\/05\/Technical-Support-300x225.jpeg\" alt=\"Technical support\" width=\"300\" height=\"225\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/Technical-Support-300x225.jpeg 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/Technical-Support-768x576.jpeg 768w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/Technical-Support.jpeg 799w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Kluczow\u0105\u00a0kwesti\u0105 z perspektywy biznesowej, by\u0107 mo\u017ce nie dostrzegan\u0105\u00a0od razu przez wi\u0119kszo\u015b\u0107\u00a0indywidualnych u\u017cytkownik\u00f3w, jest wsparcie techniczne dla oprogramowania. W momencie gdy dane oprogramowanie jest elementem wi\u0119kszego systemu dostarczanego jako us\u0142uga, istotne staje si\u0119\u00a0zagadnienie tego, jak cz\u0119sto mo\u017cna spodziewa\u0107\u00a0si\u0119 poprawek oprogramowania, kto jest za nie odpowiedzialny, czy posiada ono odpowiedni\u0105\u00a0liczb\u0119 test\u00f3w?<\/span><\/p>\n<p><span style=\"font-weight: 400\">W przypadku oprogramowania closed source takie aspekty staj\u0105 si\u0119 nieco uproszczone, gdy\u017c cz\u0119sto dostawca oprogramowania definiuje w licencji zakres wsparcia technicznego oraz posiada odpowiedni\u0105 certyfikacj\u0119 (np. us\u0142ugi <a href=\"https:\/\/azure.microsoft.com\/en-us\/blog\/windows-azure-achieves-is0-27001-certification-from-the-british-standards-institute\/\">Azure posiadaj\u0105 certyfikat IS0 27001<\/a><\/span><span style=\"font-weight: 400\">).<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nie mniej, w obszarze open source tak\u017ce mo\u017cna odnale\u017a\u0107 przyk\u0142ady wsparcia technicznego, cho\u0107 jest ono z pewno\u015bci\u0105 mniej powszechne. Takim przyk\u0142adem jest wsparcie dla ekosystemu Ubuntu <a href=\"https:\/\/ubuntu.com\/support)\">dostarczane przez organizacj\u0119 Canonical<\/a><\/span><span style=\"font-weight: 400\">.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Spo\u0142eczno\u015b\u0107 &#8211; kwestia rozwoju i bezpiecze\u0144stwa oprogramowania<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Inherentn\u0105 cech\u0105 oprogramowania open source jest mo\u017cliwo\u015b\u0107 jego modyfikacji i ulepsze\u0144 przez dowolnego u\u017cytkownika, kt\u00f3ry potrafi si\u0119 wykaza\u0107 odpowiednim poziomem umiej\u0119tno\u015bci technicznych. Dzi\u0119ki temu ka\u017cdy mo\u017ce przyczyni\u0107 si\u0119 do stworzenia lepszej jako\u015bci narz\u0119dzi, jak i pozna\u0107 detale ich implementacji. Czy mo\u017cna powiedzie\u0107, \u017ce takie oprogramowanie jest w jaki\u015b spos\u00f3b mniej lub bardziej bezpieczne od oprogramowania w\u0142asno\u015bciowego? Jest to <a href=\"https:\/\/rubygarage.org\/blog\/open-source-software-security\">otwarte zagadnienie<\/a>, natomiast nie nale\u017cy stwierdza\u0107, \u017ce oprogramowanie w\u0142asno\u015bciowe jest zdecydowanie bardziej bezpieczne od otwartego<\/span><span style=\"font-weight: 400\">. W przypadku oprogramowania zamkni\u0119tego, zesp\u00f3\u0142 odpowiedzialny za jego powstanie jest zwykle zdecydowanie mniejszy, ni\u017c\u00a0spo\u0142eczno\u015b\u0107 tworz\u0105ca kod open source, gdzie potencjalnie wi\u0119cej os\u00f3b mo\u017ce dostrzec podatno\u015bci. Z drugiej strony, firmy tworz\u0105ce oprogramowanie w\u0142asno\u015bciowe sk\u0142onne s\u0105\u00a0zatrudni\u0107 specjalist\u00f3w od cyberbezpiecze\u0144stwa, dbaj\u0105cych o przestrzeganie narzuconych dobrych praktyk, w celu tworzenia bezpiecznego i certyfikowanego oprogramowania.<\/span><\/p>\n<h1><b>Open source w kontek\u015bcie AI &#8211; za i przeciw<\/b><\/h1>\n<p><span style=\"font-weight: 400\">W tej cz\u0119\u015bci wpisu chcemy skupi\u0107\u00a0si\u0119 na zaletach i wadach tworzenia narz\u0119dzi open source zwi\u0105zanych z SI i Data Science.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Przyk\u0142ady otwartych rozwi\u0105za\u0144 SI i Data Science<\/span><\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1266\" src=\"http:\/\/architeles.pl\/ethics\/wp-content\/uploads\/2022\/05\/pytorch-300x150.png\" alt=\"PyTorch\" width=\"300\" height=\"150\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/pytorch-300x150.png 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/pytorch.png 318w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Aktualnie jeste\u015bmy \u015bwiadkami gwa\u0142townego rozwoju wszelakich bibliotek programistycznych zwi\u0105zanych z uczeniem maszynowym i analiz\u0105 danych. Popularne otwarte rozwi\u0105zania takie jak PyTorch<\/span><span style=\"font-weight: 400\">, <a href=\"https:\/\/www.tensorflow.org\/\">TensorFlow<\/a><\/span><span style=\"font-weight: 400\">, <a href=\"https:\/\/scikit-learn.org\/stable\/\">scikit-learn<\/a><\/span><span style=\"font-weight: 400\"> stosowane s\u0105 przez miliony programist\u00f3w na ca\u0142ym \u015bwiecie, ze wzgl\u0119du na przejrzyste API, \u0142atwo\u015b\u0107 integracji, jak i do\u015b\u0107 bogat\u0105 dokumentacj\u0119. Du\u017c\u0105 zalet\u0105 istnienia takiego powszechnie dost\u0119pnego, darmowego oprogramowania, jest jego nieoceniony wp\u0142yw na szybszy rozw\u00f3j ca\u0142ego obszaru badawczego Data Science. W przypadku, gdyby wymienione narz\u0119dzia by\u0142y p\u0142atne, mo\u017cna by przewidywa\u0107, \u017ce nie by\u0142oby tak niezwykle szybkiego post\u0119pu naukowego w tej dziedzinie. Dodatkowo programy open source takie jak <a href=\"https:\/\/orangedatamining.com\/\">Orange<\/a><\/span><span style=\"font-weight: 400\">\u00a0pozwalaj\u0105\u00a0na przeprowadzanie analiz nawet mniej do\u015bwiadczonym u\u017cytkownikom, co dodatkowo czyni obszar SI i DS coraz popularniejszym.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Open source AI w nauce<\/span><\/h2>\n<p><span style=\"font-weight: 400\">W aktualnie tocz\u0105cej si\u0119 dyskusji naukowej podkre\u015blana jest potrzeba otwierania dost\u0119pu do oprogramowania SI stosowanego w badaniach (<a href=\"https:\/\/www.jmlr.org\/papers\/volume8\/sonnenburg07a\/sonnenburg07a.pdf\">Sonnenburg 2007<\/a><\/span><span style=\"font-weight: 400\">). Wi\u0105\u017ce si\u0119\u00a0to z nast\u0119puj\u0105cymi zaletami:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">\u0142atwiejsza reprodukowalno\u015b\u0107 bada\u0144,<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">wi\u0119cej mo\u017cliwo\u015bci dostrze\u017cenia b\u0142\u0119d\u00f3w w badaniach i implementacji,<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">przyspieszony rozw\u00f3j naukowy dziedziny,<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">umo\u017cliwienie \u0142atwiejszego zastosowania nowych zdobyczy z obszaru SI w innych ga\u0142\u0119ziach nauki i przemys\u0142u.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">Istotnie, bardzo szybki rozw\u00f3j SI i Data Science niesie ze sob\u0105\u00a0ryzyko powstawania wielu publikacji z w\u0105tpliwej jako\u015bci wynikami. Udost\u0119pnianie oprogramowania, kt\u00f3re pozwoli\u0142o je osi\u0105gn\u0105\u0107, umo\u017cliwia popraw\u0119\u00a0jako\u015bci tworzonych bada\u0144 i opracowywanie lepszych metodologii.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Wyzwania i ograniczenia dla narz\u0119dzi SI w wolnym dost\u0119pie<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Pomimo szerokiego wachlarza zalet jakie posiadaj\u0105 otwarte narz\u0119dzia i techniki SI i Data Science, wci\u0105\u017c istnieje szereg ogranicze\u0144 dla ich powszechnego stosowania. W <a href=\"https:\/\/www.europarl.europa.eu\/RegData\/etudes\/STUD\/2021\/662908\/IPOL_STU(2021)662908_EN.pdf\">raporcie <\/a><\/span><span style=\"font-weight: 400\">przygotowanym dla komitetu zwi\u0105zanego z Parlamentem Europejskim, poza zaletami tworzenia otwartych narz\u0119dzi SI, wskazano r\u00f3wnie\u017c\u00a0ich potencjalne ograniczenia i wyzwania z nimi zwi\u0105zane.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Jednym z nich jest problem dotycz\u0105cy odpowiedzialno\u015bci za decyzje podejmowane przez otwarty system AI. W przypadku takiego systemu, wskazane musi by\u0107, do kogo mo\u017ce odwo\u0142a\u0107 si\u0119\u00a0u\u017cytkownik w przypadku ch\u0119ci poznania podstaw decyzji podj\u0119tej przez system SI, zw\u0142aszcza je\u015bli w jaki\u015b spos\u00f3b dochodzi w nim do dyskryminacji np. wybranych grup spo\u0142ecznych.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dodatkowo w raporcie zwr\u00f3cono uwag\u0119, i\u017c\u00a0otwarte systemy SI mog\u0105\u00a0by\u0107\u00a0tworzone przez wolontariuszy, kt\u00f3rzy w ka\u017cdej chwili mog\u0105\u00a0opu\u015bci\u0107\u00a0dany projekt, co mo\u017ce prowadzi\u0107\u00a0do niepowodzenia ca\u0142ego przedsi\u0119wzi\u0119cia.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ponadto, wyzwaniem w przypadku tworzenia otwartych system\u00f3w jest konieczno\u015b\u0107\u00a0zdobycia dobrej jako\u015bci du\u017cych zbior\u00f3w danych.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Interesuj\u0105cym przyk\u0142adem zmiany podej\u015bcia z tworzenia otwartego na zamkni\u0119te SI jest OpenAI. Organizacja ta jako misj\u0119 stawia sobie tworzenie rozwi\u0105za\u0144 sztucznej inteligencji dost\u0119pnych dla wszystkich. W przypadku modeli j\u0119zykowych GPT-1 oraz GPT-2, udost\u0119pni\u0142a ona ich kod \u017ar\u00f3d\u0142owy.<a href=\"https:\/\/sites.imsa.edu\/hadron\/2021\/02\/03\/openai-was-the-shift-to-closed-source-justified\/\"> Nie uczyni\u0142a tego jednak dla modelu GPT-3<\/a>, motywuj\u0105c to zagro\u017ceniami, jakie niesie udost\u0119pnienie algorytmu tworz\u0105cego realistyczny tekst w j\u0119zyku naturalnym szerszemu spo\u0142ecze\u0144stwu, w kt\u00f3rym mog\u0105 pojawi\u0107 si\u0119 jednostki pragn\u0105ce u\u017cy\u0107 go w z\u0142o\u015bliwych celach<\/span><span style=\"font-weight: 400\">. Pokazuje to, \u017ce szybki post\u0119p SI i jej otwarta dost\u0119pno\u015b\u0107 jednocze\u015bnie wi\u0105\u017ce si\u0119\u00a0z niebezpiecze\u0144stwem.<\/span><\/p>\n<p>&nbsp;<\/p>\n<h2><span style=\"font-weight: 400\">Upublicznienie algorytmu Twittera &#8211; dobry pomys\u0142?<\/span><\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-1264\" src=\"http:\/\/architeles.pl\/ethics\/wp-content\/uploads\/2022\/05\/twitter.png\" alt=\"Twitter\" width=\"247\" height=\"204\" \/><\/p>\n<p><span style=\"font-weight: 400\">Ostatnio g\u0142o\u015bnym tematem jest pomys\u0142 upublicznienia algorytmu Twittera. Wpisuje si\u0119 on w dyskusje na temat otwartego dost\u0119pu do rozwi\u0105za\u0144 SI. Osoby popieraj\u0105ce ten pomys\u0142 wskazuj\u0105, \u017ce dzi\u0119ki takiemu krokowi b\u0119dzie mo\u017cna okre\u015bli\u0107, czy faworyzuje on wybrane pogl\u0105dy i jednostki.\u00a0 <a href=\"https:\/\/www.washingtonpost.com\/technology\/2022\/04\/16\/elon-musk-twitter-algorithm\/\">Jednak w artykule Washington Post<\/a> wymieniono ograniczenia zwi\u0105zane z upublicznieniem tego kodu.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Po pierwsze, du\u017ca z\u0142o\u017cono\u015b\u0107 algorytm\u00f3w rekomendacji sprawia, \u017ce nawet upublicznienie kodu mo\u017ce nie przynie\u015b\u0107\u00a0jednoznacznych odpowiedzi dotycz\u0105cych trend\u00f3w w tre\u015bciach ukazywanych u\u017cytkownikom w serwisie. Kolejn\u0105 kwesti\u0105\u00a0jest fakt, \u017ce takie algorytmy opieraj\u0105\u00a0si\u0119\u00a0na ogromnej liczbie danych zbieranych przez serwisy spo\u0142eczno\u015bciowe. Ma\u0142o kto posiada zasoby obliczeniowe, kt\u00f3re by\u0142by w stanie je przetworzy\u0107.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Jako potencjalne ulepszenie dla istniej\u0105cego algorytmu wskazano alternatyw\u0119\u00a0w postaci mo\u017cliwo\u015bci tworzenia i dobierania algorytm\u00f3w rekomendacji tre\u015bci do w\u0142asnych potrzeb. Dzi\u0119ki temu ka\u017cdy m\u00f3g\u0142by w pewien spos\u00f3b wp\u0142yn\u0105\u0107 na to, co obserwuje na Twitterze.<\/span><\/p>\n<p>&nbsp;<\/p>\n<h2><span style=\"font-weight: 400\">Explainable AI (XAI)<\/span><\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-1263\" src=\"http:\/\/architeles.pl\/ethics\/wp-content\/uploads\/2022\/05\/grad_cam-300x151.jpeg\" alt=\"Grad-CAM\" width=\"300\" height=\"151\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/grad_cam-300x151.jpeg 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2022\/05\/grad_cam.jpeg 316w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Kwesti\u0105, kt\u00f3ra pozostaje zwi\u0105zana z transparentno\u015bci\u0105 system\u00f3w SI, jest wyja\u015bnialno\u015b\u0107 ich decyzji &#8211; zar\u00f3wno w przypadku otwartych, jak i zamkni\u0119tych rozwi\u0105za\u0144. W <a href=\"https:\/\/arxiv.org\/pdf\/1712.09923.pdf\">artykule<\/a> (Holzinger 2017) <\/span><span style=\"font-weight: 400\">wskazano, \u017ce decyzje podejmowane przez system powinny by\u0107 mo\u017cliwe do odtworzenia oraz jego u\u017cytkownik musi by\u0107 w stanie pozna\u0107, w jaki spos\u00f3b uzyskano dany wynik. Ma to du\u017ce znaczenie, zw\u0142aszcza w kontek\u015bcie mo\u017cliwo\u015bci wyst\u0119powania atak\u00f3w na sieci neuronowe, jak i obecno\u015b\u0107\u00a0biasu w modelach uczenia maszynowego. Niezale\u017cnie, czy dane narz\u0119dzie SI jest otwarte, czy zamkni\u0119te, jego decyzja powinna by\u0107 mo\u017cliwa do wyja\u015bnienia.<\/span><\/p>\n<h1><b>Podsumowanie<\/b><\/h1>\n<p><span style=\"font-weight: 400\">Istnieje aktualnie wiele narz\u0119dzi SI i Data Science w otwartym dost\u0119pie, co niesie ze sob\u0105\u00a0wiele korzy\u015bci dla ca\u0142ej ga\u0142\u0119zi nauki zwi\u0105zanej z tymi dziedzinami. Otwarte rozwi\u0105zania maj\u0105\u00a0jednak swoje ograniczenia, zwi\u0105zane g\u0142\u00f3wnie z cz\u0119stym brakiem wsparcia technicznego, problemem odpowiedzialno\u015bci za decyzje podejmowane przez system, jak i potencjalnym z\u0142o\u015bliwym u\u017cyciem takich narz\u0119dzi.<\/span><\/p>\n<h1>Literatura<\/h1>\n<ol>\n<li>Licencje open source, <a href=\"https:\/\/opensource.org\/licenses\">https:\/\/opensource.org\/licenses<\/a><\/li>\n<li>Oprogramowanie w\u0142asno\u015bciowe, <a href=\"https:\/\/en.wikipedia.org\/wiki\/Proprietary_software\">https:\/\/en.wikipedia.org\/wiki\/Proprietary_software<\/a><\/li>\n<li>Raport dochod\u00f3w firmy Google w IV kwartale 2021, <a href=\"https:\/\/www.investopedia.com\/articles\/investing\/020515\/business-google.asp\">https:\/\/www.investopedia.com\/articles\/investing\/020515\/business-google.asp<\/a><\/li>\n<li>Certyfikat IS0-27001 dla Microsoft Azure, <a href=\"https:\/\/azure.microsoft.com\/en-us\/blog\/windows-azure-achieves-is0-27001-certification-from-the-british-standards-institute\/\">https:\/\/azure.microsoft.com\/en-us\/blog\/windows-azure-achieves-is0-27001-certification-from-the-british-standards-institute\/<\/a><\/li>\n<li>Wsparcie techniczne dla Ubuntu,<a href=\"https:\/\/ubuntu.com\/support\"> https:\/\/ubuntu.com\/support<\/a><\/li>\n<li>Bezpiecze\u0144stwo system\u00f3w open source, <a href=\"https:\/\/rubygarage.org\/blog\/open-source-software-security\">https:\/\/rubygarage.org\/blog\/open-source-software-security<\/a><\/li>\n<li>PyTorch, https:\/\/pytorch.org\/<\/li>\n<li>TensorFlow, https:\/\/www.tensorflow.org\/<\/li>\n<li>scikit-learn, https:\/\/scikit-learn.org\/stable\/<\/li>\n<li>Orange Datamining, https:\/\/orangedatamining.com\/<\/li>\n<li>Sonnenburg S. et al. (2007). The Need for Open Source Software in Machine Learning. <i>J. Mach. Learn. Res.<\/i> 8 (12\/1\/2007), 2443\u20132466.<\/li>\n<li>Raport dla Parlamentu Europejskiego, <a href=\"https:\/\/www.europarl.europa.eu\/RegData\/etudes\/STUD\/2021\/662908\/IPOL_STU(2021)662908_EN.pdf\">https:\/\/www.europarl.europa.eu\/RegData\/etudes\/STUD\/2021\/662908\/IPOL_STU(2021)662908_EN.pdf<\/a><\/li>\n<li>OpenAI i GPT-3, <a href=\"https:\/\/sites.imsa.edu\/hadron\/2021\/02\/03\/openai-was-the-shift-to-closed-source-justified\/\">https:\/\/sites.imsa.edu\/hadron\/2021\/02\/03\/openai-was-the-shift-to-closed-source-justified\/<\/a><\/li>\n<li>Upublicznienie algorytmu Twittera, <a href=\"https:\/\/www.washingtonpost.com\/technology\/2022\/04\/16\/elon-musk-twitter-algorithm\/\">https:\/\/www.washingtonpost.com\/technology\/2022\/04\/16\/elon-musk-twitter-algorithm\/\u00a0<\/a><\/li>\n<li>Holzinger, A et al. (2017). What do we need to build explainable AI systems for the medical domain?<\/li>\n<\/ol>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Codziennie stajemy si\u0119 u\u017cytkownikami niezliczonych serwis\u00f3w i oprogramowania, w tym coraz cz\u0119\u015bciej takiego, kt\u00f3re zawiera w sobie elementy rozwi\u0105za\u0144 SI oraz Data Science. Bankowo\u015b\u0107 elektroniczna, serwisy spo\u0142eczno\u015bciowe, a nawet i ju\u017c\u00a0dosy\u0107 powszechnie analiza wynik\u00f3w bada\u0144 lekarskich, to miejsca, w kt\u00f3rych sztuczna inteligencja zaczyna odgrywa\u0107 coraz to bardziej znacz\u0105c\u0105\u00a0rol\u0119. W zwi\u0105zku z powszechno\u015bci\u0105\u00a0powy\u017cszych rozwi\u0105za\u0144, jak i [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[3],"tags":[15,43,10,140],"class_list":["post-1260","post","type-post","status-publish","format-standard","hentry","category-3","tag-ai","tag-data-science","tag-open-science","tag-open-source"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/1260","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/comments?post=1260"}],"version-history":[{"count":7,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/1260\/revisions"}],"predecessor-version":[{"id":1275,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/1260\/revisions\/1275"}],"wp:attachment":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/media?parent=1260"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/categories?post=1260"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/tags?post=1260"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}