Uczenie się maszyn: wykład 1
Wprowadzenie

Paweł Cichosz


Date: Semestr zimowy 1997/98

Zawartość merytoryczna wykładu 1 jest dość ograniczona -- służy on przede wszystkiem wzajemnemu poznaniu się przez studentów i prowadzącego oraz daniu pewnego przybliżonego wybrażenia o tym, co czeka nas na kolejnych wykładach. W związku z tym niniejsze notatki mają charakter szczątkowy.

Sprawy organizacyjne

Część wykładu 1 poświęcona jest sprawom organizacyjnym -- tutaj wymienione są punkty programu.

  1. Dane wykładowcy.
  2. Lista studentów.
  3. Zasady zaliczania: 2 kolokwia (40%), projekt (40%), praca domowa (15%), ogólny entuzjazm (5%).
  4. Literatura.
  5. Plan wykładów: dwie części.
  6. Projekt: dwa warianty.
  7. Strona WWW przedmiotu. Notatki do każdego wykładu.

Uczenie się i jego rodzaje

Definicja uczenia się

Proces poprawy jakości działania systemu według pewnego kryterium na podstawie doświadczeń z przeszłości. Doskonalenie zdolności do rozwiązywania pewnej klasy zadań na podstawie informacji uzyskanych na podstawie rozwiązania pewnej liczby zadań tej klasy. Zdobywanie wiedzy lub umiejętności, reprezentowanie jej wewnątrz systemu i stosowanie jej w wykonywaniu zadania.

Wiedza -- na ogół nie definiuje się lub definiuje się tylko w kontekście wybranej, specyficznej metody lub grupy metod uczenia się. Mówi się raczej o reprezentacji wiedzy.

Uczenie się a sztuczna inteligencja

Teoria i praktyka uczenia się maszyn -- głównie tzw. słaba AI.

Przykłady uczenia się

Wykład nie poda metody rozwiązania żadnego z tych problemów uczenia się, ale ukaże zestaw algorytmów, które odpowiednio rozszerzone i połączone z innymi algorytmami mogą być w tego typu problemach pomocne.

Motywacja dla uczenia się

Taksonomia metod uczenia się

  1. Wiedza deklaratywna a proceduralna (wiedza a umiejętność), ich zależności.
  2. Sposób nabywania wiedzy: bezpośrednia implantacja, przez obserwację i odkrywanie (bez nadzoru), na podstawie przykładów (z nadzorem), uczenie się na podstawie zapytań, uczenie się ze wzmocnieniem.
  3. Reprezentacja wiedzy: reguły, drzewa decyzyjne, klauzule logiki predykatów, grupowania (taksonomie), rozkłady prawdopodobieństwa, reprezentacje parametryczne, funkcje przejść automatów.

Główne działy

Główne działy uczenia się maszyn odzwierciedla plan wykładów. Brakuje ILP i paru bardziej szczegółowych zagadnień (uczenie się przez analogię, CBR, modele HMM). Pominięto sieci neuronowe, które są samodzielną dziedziną.

Terminologia i notacja dla indukcyjnego uczenia się

Ponieważ przez mniej więcej połowę semestru zajmować się będziemy teorią (krótko) oraz (znacznie dłużej) różnymi metodami indukcyjnego uczenia się pojęć na podstawie przykładów, poniżej znajduje się wykaz terminów i konwencji notacyjnych, jakie będą przy tym wykorzystywane. Po drodze na pewno trochę do tej listy trzeba będzie dodać.

Perspektywa filozoficzna

Problemy wiedzy i możliwości jej pozyskiwania zajmowały filozofów prawie od początku dziejów filozofii Zachodu. Poniżej wymieniam najbardziej znanych myślicieli, których myśl w jakiś sposób wydaje się z tymi problemami wiązać. Podsumowanie dorobku tych wybitnych postaci za pomocą jednego hasłowego zdania należy traktować ze sporym przymrużeniem oka (to jak kurs historii filozofii w 10 minut).

Sokrates:
uczenie się utożsamione z przypominaniem sobie wiedzy wrodzonej (anamneza). Pewne pokrewieństwo z uczeniem się na podstawie wyjaśnień, które polega na przetwarzaniu wiedzy wrodzonej do dogodnej postaci pod wpływem obserwowanych przykładów.
Platon:
realnie istniejące idee (pojęcia). Uczenie się nie polega na tworzeniu pojęć, lecz odkrywaniu (a właściwie przypominaniu sobie) istniejących odwiecznie pojęć.
Arystoteles:
istnieją tylko rzeczy jednostkowe, pojęcia ogólne powstają na drodze abstrakcji. Nie są one jednak arbitralne i pozbawione znaczenia, gdyż to co ogólne (wspólne) w rzeczach zawiera ich forma. Rozróżnienie dedukcji i indukcji.
Augustyn:
idee istnieją jako myśli Boga, który według nich stworzył rzeczy.
Abelard:
rozstrzygnięcie sporu o uniwersalia według którego nie istnieją one realnie, ale mają podstawę we wspólnej formie rzeczy obejmowanych przez nie.
Tomasz:
uniwersalia ante rem, in re, post rem.
Ockham:
brzytwa Ockhama wzywająca do tłumaczenia świata za pomocą najprostszych hipotez. Nominalizm (pojęcia ogólne to tylko część języka).
Kartezjusz:
idee wrodzone.
Hume:
empiryzm, idee proste powstają na podstawie wrażeń, idee złożone są ich konstrukcjami. Idee ogólne powstają przez połączenie idei konkretnych. Krytyka zasady przyczynowości, która w konsekwencji podważa prawomocość indukcji (ale akceptacja dla posługiwania się nią w praktyce).
Kant:
aprioryczne formy zmysłowości (czas, przestrzeń) i kategorie rozumu (m.in. substancja i przyczynowość) kształtują poznanie. Z perspektywy indukcyjnego uczenia się maszyn można na to patrzeć jako na bias, czyli czynnik determinujący wybór przez ucznia określonej hipotezy na podstawie dostępnych danych.
Mill:
kanony indukcji (zgodności, różnicy, reszt, zmian towarzyszących). Raczej chybione z punktu widzenia metodologii nauk przyrodniczych, lecz bliskie uczeniu się maszyn.
Avenarius:
zasada ekonomii myślenia wzywająca do konstrukcji pojęć i praw, które opisują świat w najprostszy sposób.
James:
pragmatyzm utożsamiający prawdę z długoterminową użytecznością (truth = cash value), co odpowiada w pewnym sensie założeniom uczenia się ze wzmocnieniem.
Koło wiedeńskie (m.im. Schlick, Carnap, Neurath):
zdania protokolarne jako podstawa wiedzy, weryfikowalność jako kryterium sensowności.
Russell:
podstawy współczesnej logiki matematycznej (także Frege, Whitehead). Odróżnienie formy gramatycznej zdań od ich formy logicznej.
Wittgenstein:
zwrócenie uwagi na rolę języka, który wyznacza granice myśleniu (język reprezentacji hipotez określa, czego można się nauczyć). Język logiki jako język uniwersalny (w pierwszym okresie). Względność i równoprawność języków (w drugim okresie).
Carnap:
problemy indukcji i prawdopodobieństwa wiedzy z niej pochodzącej.
Popper:
antyindukcjonizm w metodologii nauk, poznanie przez proponowanie śmiałych falsyfikowalnych hipotez i ich testowanie.

Literatura do wykładu

Książka Mitchella wymieniona jako pierwsza pozycja poniższego wykazu stanowi najlepsze źródło przystępnych informacji do sporej części (ale nie całości) materiału przedmiotu. Jednak wykład ani udostępniane notatki nie są bezpośrednio oparte na tej książce i pewne zagadnienia mogą być przedstawiane nieco inaczej. Podaną na drugim miejscu polską książeczkę polecam dlatego, że jest tam mowa o kilku interesujących nas zagadnieniach i jest ona raczej łatwo dostępna w bibliotekach, ale poziom merytoryczny i jakość prezentacji pozostawia pewne uczucie niedosytu. Pozycje z zakresu filozofii cytuję w większości z pamięci i nie ręczę za poprawność.

  1. Mitchell, T. M. Machine Learning, McGraw-Hill, 1997.
  2. Bolc, L., Zaremba, J. Wprowadzenie do uczenia się maszyn. Akademicka Oficyna Wydawnicza RM, 1992.
  3. Carbonell, J. G., Michalski, R. S., Mitchell, T. M. An overview of machine learning. W: Michalski, R. S., Carbonell, J. G., Mitchell, T. M. (eds.), Machine Learning: An Artificial Intelligence Approach, Volume 1, Tioga (obecnie Morgan Kaufmann), 1983.
  4. Tatarkiewicz, W. Historia filozofii. PWN, 1997.
  5. Russell, B. Mądrość Zachodu. Penta, 1995.
  6. Bocheński, J. M. Zarys historii filozofii. Philed, 1993.
  7. Bocheński, J. M. Współczesne metody myślenia. W drodze, 1993.

About this document ...

Uczenie się maszyn: wykład 1
Wprowadzenie

This document was generated using the LaTeX2HTML translator Version 2K.1beta (1.48)

Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

The command line arguments were:
latex2html -split 0 -no_navigation wyklad1.tex

The translation was initiated by Pawel Cichosz on 2004-03-01


Pawel Cichosz 2004-03-01