Uczenie się maszyn:
tematy projektów
Oferowane do wyboru są dwa typy tematów projektu:
- implementacyjne: polegające na całkowicie samodzielnej
implementacji pewnego algorytmu uczenia się i eksperymentalnym
zbadaniu jego właściwości w przykładowym prostym zastosowaniu,
- symulacyjne: polegające na zastosowaniu wybranego
algorytmu uczenia się (implementowanego z możliwością wykorzystania
dostępnych bibliotek) do symulowanego realistycznego zadania.
W tematach implementacyjnych nacisk jest położony na samodzielność i
jakość implementacji algorytmu oraz zakres przeprowadzonych badań. W
tematach symulacyjnych nacisk jest położony na sposób zastosowania
algorytmu do zadania, a do jego implementacji jest możliwe
wykorzystanie w pewnym zakresie (po uzgodnieniu) gotowych bibliotek.
Tematy implementacyjne
Tematy implementacyjne są określone przez rodzinę algorytmów, z której
ma pochodzić konkretny implementowany algorytm. Wybór tematu tego typu
polega na wybraniu jego numeru i przekazaniu swojej decyzji pocztą
elektroniczną.
Szczegółowy sposób interpretacji tematu, w tym wybór konkretnego
algorytmu, założenia implementacji i zakres badań, wymagają
indywidualnej konkretyzacji i uzgodnienia w ramach konsultacji. Opis
przyjętej intepretacji tematu musi się znaleźć w specyfikacji
projektu.
- Indukcja reguł.
- Indukcja drzew decyzyjnych.
- Indukcyjne programowanie logiczne.
- Uczenie się automatów.
- Uczenie się ze wzmocnieniem.
Tematy symulacyjne
Tematy symulacyjne są określone przez typ wykonywanego zadania oraz
rodzinę algorytmów, z których ma pochodzić zastosowany algorytm. Wybór
tematu tego typu polega w związku z tym na wybraniu zadania i
wykorzystywanych algorytmów uczenia się oraz przekazaniu swojej
decyzji pocztą
elektroniczną.
Każde z proponowanych zadań oraz każda z proponowanych grup algorytmów
wymaga konkretyzacji, której należy dokonać indywidualnie kierując się
własnymi zainteresowaniami i w razie potrzeby korzystając z
konsultacji. Opis skonkretyzowanego zadania i algorytmów musi się
znaleźć w specyfikacji projektu.
Zadania
Należy wybrać zadanie z poniższej listy, a przy zgłaszaniu tematu
wskazać wybrane zadanie za pomocą etykiety umieszczonej w nawiasach
kwadratowych.
- [simbad] Sterowanie mobilnego robota z wykorzystaniem
symulatora Simbad. Konkretyzacja
tego zadania wymaga określenia sensorów wykorzystywanych do
obserwacji otoczenia, dostępnych dla robota akcji (typów ruchów) i
celów działania/kryteriów oceny robota, a także
wybrania/zaprojektowania przykładowych środowisk, w których robot
się będzie poruszać.
- [torcs] Sterowanie samochodu na torze z wykorzystaniem
symulatora TORCS. Konkretyzacja
tego zadania wymaga określenia zakresu wykorzystywanych informacji
opisujących tor oraz sytuację samochodu, dostępnych dla "kierowcy"
akcji i celów działania/kryteriów oceny "kierowcy", a także wybrania
samochodu i wybrania przykładowych torów, na których będzie odbywać się jazda.
Algorytmy
Należy wybrać grupę algorytmów z poniższej listy, a przy zgłaszaniu
tematu wskazać wybraną grupę algorytmów za pomocą etykiety
umieszczonej w nawiasach kwadratowych.
- [drzewa] Indukcja drzew decyzyjnych (na podstawie
przykładów zgromadzonych w trakcie demonstracji sterowania przez
człowieka lub ustalony algorytm wzorcowy). Konkretyzacja tej grupy
algorytmów wymaga precyzyjnego określenia algorytmów budowy i
przycinania drzewa, reprezentacji przykładów (atrybutów i
kategorii), sposobu generowania przykładów trenujących oraz sposobu
wykorzystania uzyskanego drzewa do sterowania.
- [reguły] Indukcja reguł (na podstawie przykładów
zgromadzonych w trakcie demonstracji sterowania przez człowieka lub
ustalony algorytm wzorcowy). Konkretyzacja tej grupy algorytmów
wymaga precyzyjnego określenia algorytmów budowy i przycinania
zbiorów reguł, reprezentacji przykładów (atrybutów i kategorii),
sposobu generowania używanych przykładów trenujących oraz sposobu
wykorzystania zbioru reguł do sterowania.
- [rl] Uczenie się ze wzmocnieniem (na podstawie nagród
przyznawanych w trakcie sekwencji prób i błędów). Konkretyzacja tej
grupy algorytmów wymaga wybrania algorytmu uczenia się ze
wzmocnieniem, określenia reprezentacji stanów, zbioru akcji i
funkcji nagrody, metody reprezentacji funkcji wartości oraz
strategii eksploracji.
Strona przedmiotu UM
Paweł Cichosz