Metody odkrywania wiedzy


To jest strona domowa przedmiotu Metody odkrywania wiedzy z klasy tematycznej PZ-I. W ciągu semestru, w którym przedmiot jest uruchomiony, pojawiać się tu mogą bieżące komunikaty organizacyjne, więc warto od czasu do czasu zajrzeć. Ponadto dostępne są notatki do wykładów oraz informacje o projekcie.

Komentarze na temat zawartości tej strony i inne uwagi dotyczące przedmiotu proszę kierować pocztą.

Zawartość strony

  1. O przedmiocie
  2. Aktualności
  3. Zasady oceniania
  4. Projekt
  5. Kolokwia
  6. Notatki do wykładów
  7. Przykłady do wykładów
  8. Książka

O przedmiocie

Przedmiot ma na celu przedstawić najważniejsze algorytmy używane do odkrywania wiedzy w danych. Jest to dziedzina najbardziej znana pod hasłami data mining i knowledge discovery (niektórzy rozróżniają zakresy tych dwóch terminów, ale dla nas nie będzie to istotne). Chodzi w niej o wydobycie z posiadanych danych istotnych, interesujących i przydatnych zależności, które umożliwiają jakiś rodzaj wnioskowania i dają szansę na poprawienie strategii działania posiadacza tych danych. Typowe przykłady praktycznych zastosowań odkrywania wiedzy to np.:

Ostatnio popularne stały się też zagadnienia tzw. text mining, w których chodzi głównie o klasyfikację lub grupowanie dokumentów tekstowych, np. na potrzeby publicznych lub korporacyjnych portali internetowych/intranetowych.

Na wykładzie nie będą analizowane takie konkretne zastosowania, lecz będą omawiane podstawowe metody, jakich się w nich używa. Wywodzą się one głównie z dwóch dziedzin nauki: maszynowego uczenia się i statystyki. Wynika stąd częściowe podobieństwo przedmiotu Metody odkrywania wiedzy do innego przedmiotu, Uczenie się maszyn. Bardziej szczegółowe informacje zawiera oficjalny konspekt przedmiotu. Jest tam plan wykładów, chociaż zdarzają się odstępstwa od niego związane z ewolucją przedmiotu.

Aktualności

Dostępna jest już aktualna oferta tematów projektów.

Przedmiot jest realizowany po raz kolejny w semestrze zimowym 2011. Wykłady odbywają się w czwartki w godzinach 10-12 w sali 04B. Formalne zajęcia projektowe nie odbywają się -- realizacja projektu następuje samodzielnie w zespołach projektowych z możliwością korzystania z konsultacji (czwartek 8.45-10.10, pok. 215).

Zasady oceniania

Na ocenę z przedmiotu składają się dwa elementy:

Końcowa ocena jest wyznaczana na podstawie łącznej punktacji (0-100) przez zastosowanie standardowych progów.

W przypadku doktorantów stosowany jest inny elastyczny system oceniania.

Projekt

Proszę o zapoznanie się z zasadami i zgłoszenia zespołów z wybranymi tematami pocztą elektroniczną.

W obecnym semestrze projekt prowadzą:

Informacja o prowadzącym zostanie przekazana w odpowiedzi na zgłoszenie wyboru tematu.
  • Tematy projektu dla studentów.
  • Zasady realizacji projektu dla studentów.
  • Informacje o języku R. Jest to środowisko realizacji projektu dla studentów.
  • Informacje o projekcie dla doktorantów. Zasady i propozycje tematów.

    Kolokwia

    Zasady

    1. Kolokwia mają charakter "pisemnego sprawdzianu z notatkami", co oznacza, że każdy uczestnik może korzystać z dowolnych własnych (przyniesionych ze sobą) materiałów na papierze (kartek, zeszytów, książek itp.), lecz nie może się nimi wymieniać z innymi osobami.
    2. Pierwsze kolokwium odbywa się mniej więcej w połowie semestru (między 7 a 9 wykładem) w terminie ogłaszanym z dwutygodniowym wyprzedzeniem, a drugie kolokwium -- na ostatnim wykładzie w semestrze.
    3. Kolokwium poprawkowe, na którym można poprawiać ocenę z jednego bądź obu kolokwiów, jest organizowane w ostatnich dniach semestru lub pierwszych dniach sesji. Udział w nim oznacza rezygnację z oceny uzyskanej wcześniej (z wyjątkiem sytuacji, gdy stosowanie tej zasady powodowałoby niezaliczenie przedmiotu).

    Zadania

    Notatki do wykładów

    Notatki dostępne są do przeglądania w formacie HTML (z osadzonymi obrazkami dla symboli matematycznych) i do ściągnięcia w postscripcie (pliki skompresowane za pomocą programu gzip). Ponieważ przedmiot cały czas ewoluuje, faktyczny układ i zakres materiału przedstawianego obecnie na wykładzie odbiega od zawartości notatek, lecz wciąż obejmują one znaczną część omawianych zagadnień.

    Przykłady w R

    Do niektórych zagadnień omawianych na wykładzie zamierzam tu przedstawiać proste demonstracje w języku R, które mogą być punktem wyjścia do samodzielnego eksperymentowania. Zachęcam do prześledzenia i rozwinięcia tych przykładów, a w szczególności do zapoznania się z używanymi funkcjami i znaczeniem ich argumentów oraz zrozumienia stosowanych niekiedy prostych idiomów języka R, co może istotnie przyspieszyć oswajanie się z tym środowiskiem i ułatwić pracę nad projektem. Będę oczywiście wdzięczny za wytknięcie błędów, gdyby takie się tu wkradły. Numeracja przykładów jest wyłącznie orientacyjna i nie musi ściśle odpowiadać faktycznej kolejności wykładów.

    1. Przykłady do wykładu 1
    2. Przykłady do wykładu 2
    3. Przykłady do wykładu 3
    4. Przykłady do wykładu 4
    5. Przykłady do wykładu 5
    6. Przykłady do wykładu 6
    7. Przykłady do wykładu 7
    8. Przykłady do wykładu 8
    9. Przykłady do wykładu 10
    10. Przykłady do wykładu 11
    11. Przykłady do wykładu 12
    12. Przykłady do wykładu 13

    Książka

    Najbardziej obszernym materiałem pomocniczym do wykładu dostępnym w języku polskim pozostaje wciąż moja pod wieloma względami niedoskonała książka. Polecam ją jednak tylko osobom szczególnie zainteresowanym przedstawianą tematyką, które poszukują bardziej wnikliwej dyskusji zagadnień z wykłady, przy zachowaniu podobnego ujęcia oraz konwencji terminologicznych i notacyjnych.


    Strona przedmiotu UM Moja strona domowa Moja strona machine learning

    Paweł Cichosz