{"id":4174,"date":"2024-01-20T22:58:27","date_gmt":"2024-01-20T22:58:27","guid":{"rendered":"http:\/\/architeles.eu\/ethics\/?p=4174"},"modified":"2024-02-19T13:14:43","modified_gmt":"2024-02-19T13:14:43","slug":"stronniczosc-w-machine-learning","status":"publish","type":"post","link":"https:\/\/architeles.eu\/ethics\/index.php\/2024\/01\/20\/stronniczosc-w-machine-learning\/","title":{"rendered":"Stronniczo\u015b\u0107 w Machine Learning"},"content":{"rendered":"<p><strong>Stronniczo\u015b\u0107 sztucznej inteligencji mog\u0142a zosta\u0107 uznana za du\u017cy problem, mog\u0105cy oddzia\u0142ywa\u0107 na du\u017c\u0105 cz\u0119\u015b\u0107 spo\u0142ecze\u0144stwa prawdopodobnie wraz z rozpowszechnieniem si\u0119 internetu w\u015br\u00f3d u\u017cytkownik\u00f3w niekomercyjnych. W Polsce mia\u0142o to miejsce oko\u0142o 20 lat temu. W Stanach Zjednoczonych nie wi\u0119cej ni\u017c kilka lat wcze\u015bniej. Wi\u0105za\u0142o si\u0119 to bowiem z szerokim wykorzystaniem wydanej w 1998 roku wyszukiwarki Google, kt\u00f3ra za pomoc\u0105 sprawnego algorytmu by\u0142a w stanie zaproponowa\u0107 u\u017cytkownikom wyniki odpowiadaj\u0105ce zadanym w j\u0119zyku naturalnym zapytaniu. Co jednak jest miar\u0105 jako\u015bci uzyskanych wynik\u00f3w? Co to oznacza, \u017ce s\u0105 one adekwatne? Czy nie s\u0105 one tendencyjne, faworyzuj\u0105c pewne wyniki wzgl\u0119dem innych? I co najwa\u017cniejsze, jakie mog\u0105 by\u0107 skutki tej stronniczo\u015bci?<\/strong><!--more--><\/p>\n<p>Pomimo swojej sprawno\u015bci, wyszukiwarka Google nie korzysta\u0142a pocz\u0105tkowo z uczenia maszynowego, opieraj\u0105c swoje dzia\u0142anie na algorytmie <em>PageRank<\/em>. Rozw\u00f3j technologii, uczyni\u0142 j\u0105 wra\u017cliwsz\u0105 na nowe czynniki, mog\u0105ce wp\u0142ywa\u0107 na jej tendencyjno\u015b\u0107. Jest to szczeg\u00f3lnie istotne, bior\u0105c pod uwag\u0119 coraz szersze wykorzystanie uczenia maszynowego w wielu dziedzinach \u017cycia cz\u0142owieka, co mo\u017ce prowadzi\u0107 do r\u00f3\u017cnych skutk\u00f3w, kt\u00f3re mog\u0105 by\u0107 rozpatrywane z perspektywy zar\u00f3wno pojedynczych os\u00f3b, jak i ca\u0142ego spo\u0142ecze\u0144stwa. Warto jednak pami\u0119ta\u0107, jak zauwa\u017cono w (Ntoutsi i in., 2020), \u017ce pewnego rodzaju stronniczo\u015b\u0107 zawsze istnia\u0142a w spo\u0142eczno\u015bciach ludzkich od momentu ich powstania. Co jednak istotne, rozw\u00f3j sztucznej inteligencji mo\u017ce zwi\u0119kszy\u0107 jej skal\u0119 oraz sprawi\u0107, \u017ce zacznie przejawia\u0107 si\u0119 na inne sposoby. Warto do tego doda\u0107, \u017ce jej charakter mo\u017ce przejawia\u0107 si\u0119 w bardziej systemowy spos\u00f3b, uniemo\u017cliwiaj\u0105cy dopatrzenie si\u0119 ludzkiej odpowiedzialno\u015bci. Mo\u017ce r\u00f3wnie\u017c prowadzi\u0107 do wyst\u0105pienia p\u0119tli z pozytywnym sprz\u0119\u017ceniem zwrotnym, w kt\u00f3rej stronnicze predykcje systemu, w wyniku r\u00f3\u017cnych proces\u00f3w, mog\u0105 prowadzi\u0107 do dalszego zwi\u0119kszania w\u0142asnej stronniczo\u015bci.<\/p>\n<h2>Problemy ze stronniczo\u015bci\u0105<\/h2>\n<p>Jakich dziedzin \u017cycia mo\u017ce dotyczy\u0107 problem stronniczo\u015bci? Rozwa\u017cania na ten temat mo\u017cna rozpocz\u0105\u0107 od rozrywki oraz drobnych u\u017cyteczno\u015bci, maj\u0105cych usprawni\u0107 codzienne funkcjonowanie. Mo\u017cna zatem zacz\u0105\u0107 od wymienienia algorytm\u00f3w rekomenduj\u0105cych tre\u015bci w serwisach streamingowych, takich jak <em>Netflix<\/em>, <em>Spotify<\/em>, czy <em>Pinterest<\/em>. Chocia\u017c pozornie spo\u0142ecznie nieistotne, poprzez dostarczan\u0105 sztuk\u0119 mog\u0105 kszta\u0142towa\u0107 przemy\u015blenia, \u015bwiadomo\u015b\u0107 pewnych problem\u00f3w, czy og\u00f3lne poczucie estetyki swoich odbiorc\u00f3w. Poniewa\u017c algorytmy maj\u0105 dost\u0119p do danych pochodz\u0105cych z wy\u0142\u0105cznie dotychczasowej aktywno\u015bci u\u017cytkownik\u00f3w,\u00a0 mog\u0105 ci\u0105gle poleca\u0107 jedynie ju\u017c dobrze znane rodzaje dzie\u0142, zmniejszaj\u0105c szans\u0119 na odkrycie czego\u015b nowego, inspiruj\u0105cego. Dodatkowo, przez swoj\u0105 stronniczo\u015b\u0107, mog\u0105 uniemo\u017cliwi\u0107 cz\u0119\u015bci tw\u00f3rc\u00f3w uzyskanie odpowiedniego rozg\u0142osu, z kt\u00f3rym mo\u017ce by\u0107 zwi\u0105zana mo\u017cliwo\u015b\u0107 uzyskania odpowiednich przychod\u00f3w. Podobny problem mo\u017ce dotyczy\u0107 wyszukiwarek oraz sklep\u00f3w internetowych, w wyniku czego cz\u0119\u015b\u0107 sprzedawc\u00f3w, b\u0105d\u017a us\u0142ugodawc\u00f3w mo\u017ce nie by\u0107 w stanie dotrze\u0107 do potencjalnych klient\u00f3w. Stronniczo\u015b\u0107 przekazywania informacji przez serwisy informacyjne mo\u017ce skutkowa\u0107 brakiem dost\u0119pu do istotnej wiedzy. W przypadku portali randkowych, mo\u017ce natomiast zmniejszy\u0107 szans\u0119 na znalezienie odpowiedniego partnera.<\/p>\n<p>W przypadku bardziej kontrowersyjnych kwestii, takich jak wykorzystanie uczenia maszynowego w wymiarze sprawiedliwo\u015bci, decydowaniu w sprawie podj\u0119cia leczenia, oferowaniu zatrudnienia, b\u0105d\u017a udzielaniu kredyt\u00f3w, jedna decyzja mo\u017ce zawa\u017cy\u0107 na przysz\u0142ym kszta\u0142cie czyjego\u015b \u017cycia. W artykule (Angwin i in., 2013) opisano dzia\u0142anie wykorzystywanego w Stanach Zjednoczonych systemu <em>COMPAS<\/em>, maj\u0105cego przewidywa\u0107 ryzyko ponownego pope\u0142nienia przest\u0119pstwa. Przewidywa\u0142 ryzyko jako wy\u017csze w przypadku os\u00f3b czarnych, ni\u017c w przypadku os\u00f3b bia\u0142ych, nawet kiedy inne czynniki na to nie wskazywa\u0142y. W wyniku tego, do cz\u0119\u015bci os\u00f3b nies\u0142usznie przypisano wysoki wska\u017anik ryzyka, podczas gdy u innych ten wska\u017anik by\u0142 zani\u017cony. Tego typu zdarzenia mog\u0105 pos\u0142u\u017cy\u0107 jako przyk\u0142ad systemu, w kt\u00f3rym mog\u0142oby wyst\u0105pi\u0107 pozytywne sprz\u0119\u017cenie zwrotne. Grupa os\u00f3b z zawy\u017conym wska\u017anikiem ryzyka mog\u0142aby bowiem by\u0107 cz\u0119\u015bciej zatrzymywana przez policj\u0119 oraz skazywana w procesach s\u0105dowych, przez co do systemu trafia\u0142oby wi\u0119cej danych na temat pope\u0142nionych przez ni\u0105 przest\u0119pstw, co nie dzia\u0142oby si\u0119 w przypadku innych grup spo\u0142ecznych.<\/p>\n<h2>Zainteresowanie spo\u0142eczne<\/h2>\n<p>Opisana tendencyjno\u015b\u0107 systemu <em>COMPAS<\/em> oraz przedstawienie innych, podobnie dzia\u0142aj\u0105cych system\u00f3w, wywo\u0142a\u0142y oburzenie cz\u0119\u015bci spo\u0142ecze\u0144stwa oraz doprowadzi\u0142y do zwi\u0119kszenia zainteresowania tematem stronniczo\u015bci uczenia maszynowego, co znalaz\u0142o odbicie w liczbie po\u015bwi\u0119conych mu publikacji. Poni\u017cszy wykres przedstawia ilo\u015b\u0107 bada\u0144 na stronie dimensions.ai odpowiadaj\u0105cych zapytaniu \u201c<em>bias in machine learning<\/em>\u201d od 2000 roku.<\/p>\n<figure id=\"attachment_4176\" aria-describedby=\"caption-attachment-4176\" style=\"width: 600px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"size-large wp-image-4176\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-1024x683.png\" alt=\"\" width=\"600\" height=\"400\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-1024x683.png 1024w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-300x200.png 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-768x512.png 768w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-1536x1024.png 1536w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-2048x1365.png 2048w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/publications-75x50.png 75w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><figcaption id=\"caption-attachment-4176\" class=\"wp-caption-text\">Ilo\u015b\u0107 bada\u0144 na stronie dimensions.ai odpowiadaj\u0105cych zapytaniu \u201cbias in machine learning\u201d od 2000 roku.<\/figcaption><\/figure>\n<p>Zainteresowanie ro\u015bnie r\u00f3wnie\u017c w\u015br\u00f3d og\u00f3\u0142u spo\u0142ecze\u0144stwa, co przejawia si\u0119 we wzro\u015bcie liczby zapyta\u0144 o has\u0142a \u201c<em>ai bias<\/em>\u201d oraz \u201c<em>machine learning bias<\/em>\u201d, przedstawionej na stronie trends.google.com.<\/p>\n<figure id=\"attachment_4175\" aria-describedby=\"caption-attachment-4175\" style=\"width: 600px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"size-large wp-image-4175\" src=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/google_trends-1024x367.png\" alt=\"\" width=\"600\" height=\"215\" srcset=\"https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/google_trends-1024x367.png 1024w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/google_trends-300x108.png 300w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/google_trends-768x275.png 768w, https:\/\/architeles.eu\/ethics\/wp-content\/uploads\/2024\/01\/google_trends.png 1420w\" sizes=\"auto, (max-width: 600px) 100vw, 600px\" \/><figcaption id=\"caption-attachment-4175\" class=\"wp-caption-text\">Liczba zapyta\u0144 o has\u0142a \u201cai bias\u201d oraz \u201cmachine learning bias\u201d w wyszukiwarce Google<\/figcaption><\/figure>\n<h2>Kategoryzacja problemu<\/h2>\n<p>Problem tendencyjno\u015bci jest z\u0142o\u017cony i rozwa\u017caj\u0105c go, mo\u017cna skupia\u0107 si\u0119 na r\u00f3\u017cnych jego aspektach. Bior\u0105c to pod uwag\u0119, konieczne staje si\u0119 wprowadzenia klasyfikacji jej mo\u017cliwych \u017ar\u00f3de\u0142. Zadanie to zosta\u0142o podj\u0119te w wielu pracach. Dla przyk\u0142adu (Roselli et al., 2019) wyr\u00f3\u017cnia trzy potencjalne miejsca przejawiania si\u0119 stronniczo\u015bci: okre\u015blenie celu wykorzystania uczenia maszynowego, og\u00f3lne cechy ca\u0142ego zbioru danych oraz charakterystyka indywidualnych pr\u00f3bek danych. Z kolei (Schwartz et al., 2022) szczeg\u00f3\u0142owo rozwa\u017ca ten problem i przedstawia trzy g\u0142\u00f3wne kategorie stronniczo\u015bci: systemowa (historyczne, spo\u0142eczne, instytucjonalne), ludzka (indywidualne i grupowe) oraz statystyczna i obliczeniowa (przy przetwarzaniu i walidacji, u\u017cyciu i interpretacji oraz wyboru i pr\u00f3bkowania). Poza wyr\u00f3\u017cnieniem poszczeg\u00f3lnych kategorii i podkategorii, w pracy zostaje szczeg\u00f3\u0142owo opisane, jakie mog\u0105 by\u0107 przyczyny poszczeg\u00f3lnych b\u0142\u0119d\u00f3w.<\/p>\n<p>Problem ten jest rozpatrywany r\u00f3wnie\u017c w wielu innych pracach, jednak (Mehrabi et al., 2021) pozwala na przedstawienie go w szeroki, ale jednocze\u015bnie uporz\u0105dkowany spos\u00f3b. R\u00f3wnie\u017c wyr\u00f3\u017cniaj\u0105c trzy potencjalne \u017ar\u00f3d\u0142a stronniczo\u015bci:<\/p>\n<ol>\n<li>Dane, przy pomocy kt\u00f3rych trenowany jest algorytm. W tej kategorii znajduj\u0105 si\u0119 problemy zwi\u0105zane z m.in. pozyskaniem danych (sposobem mierzenia), pomijaniem istotnych zmiennych, korzystaniu z niereprezentatywnej pr\u00f3by, czy te\u017c nadmiernemu generalizowaniu.<\/li>\n<li>Algorytm, kt\u00f3ry korzystaj\u0105c z danych dostarcza u\u017cytkownikom wynik\u00f3w. Mo\u017cna tutaj zakwalifikowa\u0107 wszelkie problemy zwi\u0105zane z wykonywanymi obliczeniami, operacjami statystycznymi, czy samymi cechami wybranych algorytm\u00f3w, takimi jak spos\u00f3b dokonywania ewaluacji. Co wi\u0119cej, znajduj\u0105 si\u0119 tutaj wszelkie kwestie zwi\u0105zane z tym, w jaki spos\u00f3b, u\u017cytkownicy obcuj\u0105 z otrzymanymi wynikami.<\/li>\n<li>U\u017cytkownicy, kt\u00f3rzy swoim dzia\u0142aniem wp\u0142ywaj\u0105 na dane. Nale\u017cy tutaj uwzgl\u0119dni\u0107 wszelkie aspekty spo\u0142eczne i historyczne, sprawiaj\u0105ce \u017ce pozyskane dane zawieraj\u0105 pewn\u0105 tendencyjno\u015b\u0107. Jako przyk\u0142ad mo\u017cna poda\u0107 sugerowanie si\u0119 opiniami znajomych podczas oceniania film\u00f3w, b\u0105d\u017a cz\u0119stsze uczestniczenie student\u00f3w w r\u00f3\u017cnych badaniach, ze wzgl\u0119du na \u0142atwiejszy dost\u0119p.<\/li>\n<\/ol>\n<p>Takie uj\u0119cie problemu mo\u017ce pozwoli\u0107 na rozszerzenie pola poszukiwa\u0144 jego potencjalnych rozwi\u0105za\u0144 oraz na zauwa\u017cenie, \u017ce kwestia stronniczo\u015bci uczenia maszynowego mo\u017ce niekiedy by\u0107 postrzegana jako odbicie strukturalnych problem\u00f3w spo\u0142ecznych.<\/p>\n<p>&nbsp;<\/p>\n<p><b>Bibliografia<\/b><\/p>\n<p><i>AI Bias, Machine Learning Bias<\/i>. (20.01.2024). Google Trends. Ostatni dost\u0119p: 20.01.2024, https:\/\/trends.google.com\/trends\/explore?date=all&amp;q=ai%20bias,machine%20learning%20bias&amp;hl=en<\/p>\n<p>Angwin, J., Larson, J., Mattu, S., &amp; Kirchner, L. (2016). Machine Bias. <i>ProPublica<\/i>.<\/p>\n<p><i>Dimensions &#8211; Dimensions AI<\/i>. (20.01.2024). Dimensions. Ostatni dost\u0119p: 20.01.2024, https:\/\/app.dimensions.ai\/discover\/publication<\/p>\n<p>Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K., &amp; Galstyan, A. (2021). A Survey on Bias and Fairness in Machine Learning. <i>Association for Computing Machinery<\/i>, <i>54<\/i>. https:\/\/doi.org\/10.1145\/3457607<\/p>\n<p>Ntoutsi, E., Fafalios, P., Gadiraju, U., Iosifidis, V., Nejdl, W., Vidal, M.-E., Ruggieri, S., &amp; Turini, F. (2020). Bias in data-driven artificial intelligence systems\u2014An introductory survey. <i>WIREs Data Mining and Knowledge Discovery<\/i>, <i>10<\/i>(3). https:\/\/doi.org\/10.1002\/widm.1356<\/p>\n<p>Roselli, D., Matthews, J., &amp; Talagala, N. (2019). Managing Bias in AI. <i>Association for Computing Machinery<\/i>, 539\u2013544. https:\/\/doi.org\/10.6028\/NIST.SP.1270<\/p>\n<p>Schwartz, R., Vassilev, A., Greene, K., Perine, L., Burt, A., &amp; Hall, P. (2022). Towards a Standard for Identifying and Managing Bias in Artificial Intelligence. <i>National Institute of Standards and Technology<\/i>, <i>NIST Special Publication 1270<\/i>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Stronniczo\u015b\u0107 sztucznej inteligencji mog\u0142a zosta\u0107 uznana za du\u017cy problem, mog\u0105cy oddzia\u0142ywa\u0107 na du\u017c\u0105 cz\u0119\u015b\u0107 spo\u0142ecze\u0144stwa prawdopodobnie wraz z rozpowszechnieniem si\u0119 internetu w\u015br\u00f3d u\u017cytkownik\u00f3w niekomercyjnych. W Polsce mia\u0142o to miejsce oko\u0142o 20 lat temu. W Stanach Zjednoczonych nie wi\u0119cej ni\u017c kilka lat wcze\u015bniej. Wi\u0105za\u0142o si\u0119 to bowiem z szerokim wykorzystaniem wydanej w 1998 roku wyszukiwarki Google, [&hellip;]<\/p>\n","protected":false},"author":163,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[314],"tags":[344,346,20,345,188],"class_list":["post-4174","post","type-post","status-publish","format-standard","hentry","category-socjologia-uj-2023-24","tag-bias","tag-stronniczosc","tag-sztuczna-inteligencja","tag-tendencyjnosc","tag-uczenie-maszynowe"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/4174","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/users\/163"}],"replies":[{"embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/comments?post=4174"}],"version-history":[{"count":2,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/4174\/revisions"}],"predecessor-version":[{"id":4178,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/posts\/4174\/revisions\/4178"}],"wp:attachment":[{"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/media?parent=4174"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/categories?post=4174"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/architeles.eu\/ethics\/index.php\/wp-json\/wp\/v2\/tags?post=4174"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}