Data Mining

General

Course Contents

  • Introduction to data mining techniques. a) data types b) problems, c) applications, d) general data analysis and processing techniques.
  • Data pre-processing: a) data cleaning, b) data transformation.
  • Clustering: a) introduction to clustering methods, b) distance measures, c) k-means, d) hierarchical clustering.
  • Data classification: (a) introduction to classification methods, (b) decision trees, (c) statistical techniques, (d) overfitting, (c) missing values, (d) model evaluation indexes, (e) classifiers Bayes classifiers, k-nearest neighbors f) classification in multidimensional time series data.
  • Association rules: a) item sets b) support b) confidence c) a-priori algorithm.
  • Dimensionality reduction techniques: Feature selection algorithms a) wrappers, b) filters, c) embedded.
  • Knowledge discovery with Data Warehouses.
  • Applications: Data mining techniques on biomedical data, business data, images data, text data and the Internet data.
  • Google Analytics, Bussiness Analytics.

Educational Goals

Data mining is usually associated with the analysis of the large data sets present in the fields of big data, machine learning and artificial intelligence. The process looks for patterns, anomalies and associations in the data with the goal of extracting value. Here is the list of important areas where data mining is widely used: Healthcare, Market Basket Analysis, Manufacturing Engineering, CRM, Fraud Detection, Intrusion Detection, Customer Segmentation, Financial Banking.

General Skills

  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών.
  • Ομαδική Εργασία.
  • Σχεδιασμός και Διαχείριση Δεδομένων Μεγάλου Όγκου.
  • Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης.

Teaching Methods

  • Θεωρητική από έδρας διδασκαλία με συζήτηση και ενεργή συμμετοχή των φοιτητών. Κατά τη διάρκεια του μαθήματος γίνονται παρουσιάσεις σε power point.
  • Εργαστηριακές Ασκήσεις. Ηλεκτρονικό υλικό για τους αλγορίθμους Εξόρυξης Γνώσης.
  • Επίλυση Ασκήσεων.
  • Επίδειξη στο προβολικό και χρήση πίνακα.

Use of ICT means

  • Χρήση εξειδικευμένου λογισμικού. Υποστήριξη Μαθησιακής διαδικασίας μέσω της ηλεκτρονικής πλατφόρμας.
  • Ηλεκτρονικές Ασκήσεις Αυτοαξιολόγησης.
  • Επικοινωνία με φοιτητές μέσω e-mail και της ιστοσελίδας του μαθήματος.

Teaching Organization

ActivitySemester workload
Lectures26
Practice Exercises13
Laboratory Exercises13
Writing laboratory reports13
Autonomous Study60
Total125

Students Evaluation

Ο τελικός βαθμός του μαθήματος διαμορφώνεται κατά 60% από τον βαθμό του θεωρητικού μέρους και κατά 40% από τον βαθμό του εργαστηριακού.

  1. Η γραπτή τελική εξέταση του θεωρητικού μέρους περιλαμβάνει:
    • Ερωτήσεις πολλαπλής επιλογής.
    • Επίλυση προβλημάτων εφαρμογής των γνώσεων που αποκτήθηκαν.
    • Ερωτήσεις σύντομης απάντησης.
    • Συγκριτική αξιολόγηση στοιχείων θεωρίας.
  2. Η εξέταση των ασκήσεων του εργαστηρίου περιλαμβάνει:
    • Την αξιολόγηση των εργαστηριακών δεξιοτήτων που αποκτήθηκαν μέσω εξέτασης των εργαστηριακών αναφορών κατά την οποία γίνεται και χρήση του εργαστηριακού εξοπλισμού (30%).
    • Γραπτή τελική εξέταση/εργασία (70%).

 

Recommended Bibliography

Συγγράμματα μέσω του συστήματος ΕΥΔΟΞΟΣ:

  1. P.N. Tan, M. Steinbach, V. Kumar. Εισαγωγή στην Εξόρυξη Δεδομένων, Εκδόσεις Τζιόλα, 2009. (Introduction to Data Mining, Addison Wesley, 2006 ) (Εύδοξος).
  2. M. H. Dunham. Data Mining: Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα,Εκδόσεις Νέων Τεχνολογιών, 2004 (Data Mining: Introductory and Advanced Topics, Prentice Hall, 2003) (Εύδοξος).

Συγγράμματα που διανέμονται μέσω της ηλεκτρονικής σελίδας του μαθήματος:

  1. Α.ΤΣΙΜΠΙΡΗΣ, Εξόρυξη Γνώσης – Εργαστηριακές ασκήσεις, Σέρρες, 2018.

Συμπληρωματική προτεινόμενη βιβλιογραφία:

  1. J. Han, M. Kamber, J. Pei. Data Mining : Concepts and Techniques (3rd edition), Morgan Kaufmann, 2011.
  2. M. Kantardzic. Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, 2002.
  3. I.H. Witten, E. Frank, M.A. Hall. Data Mining: Practical Machine Learning Tools and Techniques, (3rd edition), Morgan Kaufmann, 2011.
  4. Μ. Βαζυργιάννης και Μ. Χαλκίδη. Εξόρυξη Γνώσης από Βάσεις Δεδομένων, και τον Παγκόσμιο Ιστό, – Γιώργος Δαρδανός, 2005.
  5. Α. Νανόπουλος, Ι. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη και τις Αποθήκες Δεδομένων, Εκδόσεις Νέων Τεχνολογιών, 2008.