Uczenie maszynowe (ang. machine learning)

Uczenie maszynowe to metoda analizy danych oparta na idei sztucznej inteligencji, wykorzystująca automatyczne modele analityczne do przeprowadzenia procesów decyzyjnych, w tym szczególnie na dużych bazach danych. Głównym założeniem uczenia maszynowego jest przekonanie, że systemy komputerowe mogą przetwarzać dane wejściowe bez pełnego zaprogramowania, a więc uczyć się podejmować decyzje poprzez samodzielną identyfikację wzorców danych przy minimalnej interwencji ze strony człowieka. Uczenie maszynowe jest ściśle związane ze statystyką obliczeniową, która koncentruje się również na prognozowaniu za pomocą komputerów i ma silne powiązania z matematyczną optymalizacją. Ponadto, uczenie maszynowe jest spokrewnione z analizą danych eksploracyjnych w zakresie możliwości uczenia się bez nadzoru człowieka oraz robotyką.

Sama nazwa "uczenie maszynowe" się została po raz pierwszy użyta w 1959 r. przez Artura Samuela dla określenia prac nad budową algorytmów, które mogą samodzielnie przetwarzać dane i poprawiać efektywność poprzez zdobywane doświadczenie. Współczesne prace badawcze wskazują, że w odróżnieniu do tradycyjnych technik komputerowych, algorytmy uczenia maszynowego przekraczają ściśle określone instrukcje i z tego względu tworzą nową jakość na tle pasywnie funkcjonujących programów komputerowych. Zdolność do samodzielnego budowania wiedzy przez maszyny jest wykorzystywana do podejmowania decyzji, które niejako uczą się na podstawie doświadczenia z przetwarzania danych wejściowych, ale bez wyraźnego zaprogramowania w tym celu. W skrócie, człowiek wybiera odpowiedni model decyzyjny i zasila go danymi, a model w pełni autonomicznie dostosowuje swoje parametry, aby poprawić wyniki w kolejnych interakcjach. Z biegiem czasu trafność i efektowość decyzji wzrasta, co prowadzi do futurystycznych wizji osiągniecia przez maszyny stanu pełnej niezależności na bazie sztucznej inteligencji.

Uczenie maszynowe czasami jest postrzegane jako metoda uczenia się podobna do ludzkiego myślenia. Jednakże w tym zakresie występują istotne różnice. Maszyna może standaryzować proces uczenia się i wydobywać wyniki uczenia się (tzw. modele), dzięki czemu wyniki są powtarzalne i ściśle zależą od algorytmów i jakości danych wejściowych. Wiedza ludzka nie zachowuje reguł tak ścisłej ścieżki przetwarzania danych, przez co te same dane wejściowe oznaczają często krańcowo różne decyzje wśród ludzi. Maszyny mogą uczyć się na dużych ilościach danych, podczas gdy ludzki umysł ma pod tym względem naturalne ograniczenia, ale równocześnie efektywniej wnioskuje nawet na bardzo małej próbie danych. Maszyny są skuteczniejsze w rozwiązywaniu jednoznacznych problemów (odpowiedzi: tak lub nie), a ludzie są zdecydowanie lepsi w rozwiązywaniu złożonych, tzw. "rozmytych" problemów, ze względu na możliwość uwzględnienia całego kontekstu danej sytuacji.

Zadania związane z uczeniem maszynowym są zazwyczaj klasyfikowane w kilku szerokich kategoriach:

  1. Nadzorowane uczenie się - komputer jest zasilany przez człowieka przykładowymi danymi wejściowymi i wskazywane są też pożądane wyniki, a celem procesu uczenia się jest zidentyfikowanie przez maszynę ogólnej zasady przetwarzania danych. Algorytm uczy się, porównując swój rzeczywisty wynik z poprawnymi wynikami, aby znaleźć błędy i następnie sam odpowiednio zmodyfikować algorytm decyzyjny. Nadzorowane uczenie się jest stosowane w tych aplikacjach, w których dane historyczne są podstawą prawidłowego wnioskowania o przyszłych zdarzeniach. Na przykład system może przewidywać, kiedy transakcje dokonane kartą kredytową mogą być nieuczciwe lub który klient z polisą ubezpieczeniową prawdopodobnie złoży wniosek o odszkodowanie.
  2. Niepełne, nadzorowane uczenie się - komputer otrzymuje tylko niepełny zestaw danych wejściowych z brakującymi wyjściami docelowymi dla samodzielnego zidentyfikowania luk w procesie decyzyjnym.
  3. Uczenie się bez nadzoru – komputer nie uzyskuje ani pełnej ani częściowej konstrukcji wzorca decyzyjnego się i jego odkrycie to główne zadanie. Uczenie się bez nadzoru może być celem samym w sobie dla samodzielnego odkrywania ukrytych powiązań w zbiorze danych. Dlatego też uczenie bez nadzoru wykorzystuje się w przypadku danych, które nie mają historycznych wyników, a więc systemowi nie wskazano "właściwej odpowiedzi". Celem jest zbadanie struktury zbioru danych. Uczenie się bez nadzoru jest wykorzystywane do analizy dużych zbiorów danych np. transakcyjnych. Przykładowo może posłużyć do identyfikowania segmentów klientów o podobnych behawioralnych atrybutach popytu, jako klientów docelowych lub pozwala zidentyfikować najważniejsze atrybuty, które odróżniają od siebie segmenty klientów.

Możliwość wykonywania automatycznego złożonych obliczeń na bazie dużych zbiorów danych jest cennym atrybutem uczenia maszynowego, szczególnie w zakresie technik bezpośredniej komunikacji maszyn w ramach Internet Rzeczy (Internet of Things). Przykładem może być samodzielny samochód Google, tworzenie automatycznych ofert rekomendacji online dla danego klienta w Amazon lub identyfikowania zainteresowań użytkowników Netflix. Uczenie maszynowe ma jednak również znacznie bardziej prozaiczne zastosowania. Przykładowo, podczas korzystania z przeglądarek internetowych i aplikacji mobilnych, witryny, zbierają ogromne ilości danych o zainteresowaniach i zachowaniach użytkowników. Uczenie maszynowe pozawala wówczas na przetwarzanie tych danych w celu zindywidualizowania zawartości witryn do każdego z milionów odwiedzających, co szczególnie jest często wykorzystywane w zakresie przekazów reklamowych.

Szczególne znaczenie uczenie maszynowe ma w sektorze finansowym, w którym przetwarzane są ogromne zbiory indywidulanych danych w celu sprofilowania klienta według klasy ryzyka. Innym wykorzystaniem danych jest automatycznie zdiagnozowanie aktualnych i przyszłych potrzeb klientów za pomocą algorytmów, który stale gromadzą dane i samodzielnie poprawiają swoją efektywność.

Wobec coraz bardziej zaawansowanych technik pozyskiwania i przetwarzania danych, regulatorzy wprowadzają przepisy nakładające szereg obowiązków na instytucje finansowe i podmioty gospodarcze w zakresie przejrzystości procesowania danych klientów oraz nadania konsumentom uprawnień dla świadomego ograniczania tych procesów (np. Rozporządzenie o ochronie danych osobowych - General Data Protection Regulation - RODO).

Żródła:

  1. https://www.sas.com/en_ae/insights/analytics/machine-learning.html
  2. https://www.techemergence.com/ai-in-banking-analysis/
  3. https://techburst.io/5-use-cases-of-machine-learning-in-the-banking-industry-a4cfbedda722
  4. https://hothardware.com/news/jpmorgan-used-coin-machine-learning-program-to-eliminate-360000-lawyer-hours-a-year
Mało? Czytaj kolejny wpis...

Przeczytaj też