TIES445 Data Mining (3–5 cr)
Study level:
Advanced studies
Grading scale:
0-5
Language:
English
Responsible organisation:
Faculty of Information Technology
Curriculum periods:
2020-2021, 2021-2022, 2022-2023
Description
Sisältö
Kurssilla perehdytään suurten ja epätäydellisten datamassojen analyysi- eli tiedonlouhintamenetelmiin. Kurssin aluksi käydään läpi peruskäsitteet, määritelmät ja tiedonlouhinta-menetelmien kehittämiseen ja soveltamiseen liittyviä haasteita. Perehdytään tietämyksen etsintä (KDD) prosessin eri vaiheisiin sekä niissä sovellettaviin menetelmiin. Käydään läpi eri tyyppisissä tiedonlouhintaongelmissa käytettäviä menetelmiä. Tutustaan menetelmien soveltamiseen käytännön aineistoissa. Harjoitukset ja projektityö tapahtuvat Matlab-ohjelmistoa käyttäen.
Suoritustavat
Tentti, demot ja projektityö.
Learning outcomes
-
Description of prerequisites
Ohjelmointi 2 ja Algoritmit 2. Matematiikan perusopinnot suositeltavia.
Study materials
Principles of Data Mining, D. Hand, H. Mannila, and P. Smyth, MIT Press, 2001. P-N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Addison Wesley, 2005. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006. Wang, X.
Completion methods
Method 1
Select all marked parts
Parts of the completion methods
x
Teaching (3–5 cr)
Type:
Participation in teaching
Grading scale:
0-5
Language:
English