Εξόρυξη Γνώσης

Γενικά

Περιεχόμενα μαθήματος

  • Εισαγωγή στις τεχνικές εξόρυξης δεδομένων. α) δεδομένα, β) προβλήματα, γ) εφαρμογές, δ) γενικές τεχνικές ανάλυσης και επεξεργασίας δεδομένων.
  • Προ-επεξεργασία δεδομένων: α) καθαρισμός δεδομένων, β) μετασχηματισμός δεδομένων.
  • Συσταδοποίηση (clustering): α) εισαγωγή στη συσταδοποίηση, β) μέτρα αποστάσεων, γ) k-means, δ) ιεραρχική συσταδοποίηση.
  • Κατηγοριοποίηση δεδομένων (Classification): α) εισαγωγή, β) δέντρα αποφάσεων (decision trees) γ) στατιστικές τεχνικές, δ) overfitting, γ) missing values, δ) δείκτες αποτίμησης μοντέλου, ε) άλλα είδη κατηγοριοποιητών (ταξινομητές με κανόνες, kκοντινότεροι γείτονες (k-nearest neighbors) στ) αλγόριθμοι κατηγοριοποίησης σε πολυδιάστατα δεδομένα χρονοσειρών, ζ) εύρεση συσχετισμών σε σχεσιακά δεδομένα.
  • Κανόνες συσχέτισης (association rules) : a) στοιχειοσύνολα (item sets) β)υποστήριξη (support) β) εμπιστοσύνη (confidence), γ) ο αλγόριθμος a-priori.
  • Τεχνικές μείωσης διαστάσεων: Αλγόριθμοι επιλογής χαρακτηριστικών α) wrappers , β) filters, γ) embedded.
  • Εξόρυξη γνώσης από Αποθήκες Δεδομένων (Data Warehouses).
  • Εφαρμογές: εφαρμογή των τεχνικών εξόρυξης δεδομένων σε προβλήματα βιοϊατρικής, σε δεδομένα επιχειρήσεων, σε εικόνες, κείμενο και στο διαδίκτυο.
  • Google Analytics, Bussiness Analytics.

Μαθησιακοί Στόχοι

Το μάθημα αυτό έχει ως σκοπό την παροχή βασικών γνώσεων των αρχών, των διαδικασιών και των εφαρμογών της Εξόρυξης Δεδομένων, ώστε οι φοιτητές μετά την ολοκλήρωση των μαθημάτων να μπορούν να κατανοήσουν τους βασικούς αλγόριθμους εξόρυξης δεδομένων και να έχουν αποκτήσει τις κατάλληλες δεξιότητες υλοποίησης των αλγορίθμων αυτών ώστε σε μελλοντικά προβλήματα που θα εμφανιστούν μπροστά τους να μπορούν να εφαρμόζουν τις κατάλληλες τεχνικές εξόρυξης δεδομένων ανάλογα με την περίπτωση του προβλήματος.

Γενικές Ικανότητες

  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών.
  • Ομαδική Εργασία.
  • Σχεδιασμός και Διαχείριση Δεδομένων Μεγάλου Όγκου.
  • Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης.

Μέθοδοι Διδασκαλίας

  • Θεωρητική από έδρας διδασκαλία με συζήτηση και ενεργή συμμετοχή των φοιτητών. Κατά τη διάρκεια του μαθήματος γίνονται παρουσιάσεις σε power point.
  • Εργαστηριακές Ασκήσεις. Ηλεκτρονικό υλικό για τους αλγορίθμους Εξόρυξης Γνώσης.
  • Επίλυση Ασκήσεων.
  • Επίδειξη στο προβολικό και χρήση πίνακα.

Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών

  • Χρήση εξειδικευμένου λογισμικού. Υποστήριξη Μαθησιακής διαδικασίας μέσω της ηλεκτρονικής πλατφόρμας.
  • Ηλεκτρονικές Ασκήσεις Αυτοαξιολόγησης.
  • Επικοινωνία με φοιτητές μέσω e-mail και της ιστοσελίδας του μαθήματος.

Οργάνωση Διδασκαλίας

ΔραστηριότηταΦόρτος εργασίας εξαμήνου
Διαλέξεις26
Ασκήσεις Πράξης13
Εργαστηριακές Ασκήσεις13
Συγγραφή εργαστηριακών αναφορών13
Αυτοτελής Μελέτη60
Σύνολο125

Αξιολόγηση Φοιτητών

Ο τελικός βαθμός του μαθήματος διαμορφώνεται κατά 60% από τον βαθμό του θεωρητικού μέρους και κατά 40% από τον βαθμό του εργαστηριακού.

  1. Η γραπτή τελική εξέταση του θεωρητικού μέρους περιλαμβάνει:
    • Ερωτήσεις πολλαπλής επιλογής.
    • Επίλυση προβλημάτων εφαρμογής των γνώσεων που αποκτήθηκαν.
    • Ερωτήσεις σύντομης απάντησης.
    • Συγκριτική αξιολόγηση στοιχείων θεωρίας.
  2. Η εξέταση των ασκήσεων του εργαστηρίου περιλαμβάνει:
    • Την αξιολόγηση των εργαστηριακών δεξιοτήτων που αποκτήθηκαν μέσω εξέτασης των εργαστηριακών αναφορών κατά την οποία γίνεται και χρήση του εργαστηριακού εξοπλισμού (30%).
    • Γραπτή τελική εξέταση/εργασία (70%).

 

Συνιστώμενη Βιβλιογραφία

Συγγράμματα μέσω του συστήματος ΕΥΔΟΞΟΣ:

  1. P.N. Tan, M. Steinbach, V. Kumar. Εισαγωγή στην Εξόρυξη Δεδομένων, Εκδόσεις Τζιόλα, 2009. (Introduction to Data Mining, Addison Wesley, 2006 ) (Εύδοξος).
  2. M. H. Dunham. Data Mining: Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα,Εκδόσεις Νέων Τεχνολογιών, 2004 (Data Mining: Introductory and Advanced Topics, Prentice Hall, 2003) (Εύδοξος).

Συγγράμματα που διανέμονται μέσω της ηλεκτρονικής σελίδας του μαθήματος:

  1. Α.ΤΣΙΜΠΙΡΗΣ, Εξόρυξη Γνώσης – Εργαστηριακές ασκήσεις, Σέρρες, 2018.

Συμπληρωματική προτεινόμενη βιβλιογραφία:

  1. J. Han, M. Kamber, J. Pei. Data Mining : Concepts and Techniques (3rd edition), Morgan Kaufmann, 2011.
  2. M. Kantardzic. Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, 2002.
  3. I.H. Witten, E. Frank, M.A. Hall. Data Mining: Practical Machine Learning Tools and Techniques, (3rd edition), Morgan Kaufmann, 2011.
  4. Μ. Βαζυργιάννης και Μ. Χαλκίδη. Εξόρυξη Γνώσης από Βάσεις Δεδομένων, και τον Παγκόσμιο Ιστό, – Γιώργος Δαρδανός, 2005.
  5. Α. Νανόπουλος, Ι. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη και τις Αποθήκες Δεδομένων, Εκδόσεις Νέων Τεχνολογιών, 2008.