Μοντέλα Μηχανικής Μάθησης

Διδάσκων

Απ. Μπουρνέτας

 

Σκοπός του μαθήματος

Το αντικείμενο του μαθήματος είναι η μελέτη μαθηματικών και στατιστικών μοντέλων για το σχεδιασμό αλγορίθμων πρόβλεψης, οι οποίοι έχουν την ιδιότητα να βελτιώνονται σταδιακά μέσω των δεδομένων που εισάγονται σε αυτούς προσομοιώνοντας μια διαδικασία εκμάθησης. Το μεθοδολογικό υπόβαθρο των αλγορίθμων μηχανικής μάθησης αναφέρεται κυρίως σε πιθανότητες, στατιστική ανάλυση δεδομένων, βελτιστοποίηση και υπολογιστικά μαθηματικά.

Σκοπός του μαθήματος είναι αφενός η εισαγωγή στις βασικές αρχές και προσεγγίσεις της μηχανικής μάθησης, με έμφαση σε πιθανοτικές και στατιστικές μεθόδους και αφετέρου η εφαρμογή των θεωρητικών μοντέλων με την ανάπτυξη κατάλληλων υπολογιστικών αλγορίθμων, με βασικό πλαίσιο εφαρμογών τη Βιοστατιστική και τις Επιστήμες Υγείας. Το απαραίτητο υπόβαθρο για την παρακολούθηση του μαθήματος είναι γνώση πιθανοτήτων, στατιστικής και βασικής θεωρίας βελτιστοποίησης, όπως επίσης εξοικείωση με βασικές μεθόδους προγραμματισμού στη γλώσσα python ή R.

Εκπαιδευτικοί στόχοι του μαθήματος

Μετά την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής θα είναι εξοικειωμένος με τις εξής θεωρητικές και μεθοδολογικές έννοιες: Επιβλεπόμενη και μη επιβλεπόμενη μάθηση, προβλεπτικές συναρτήσεις, μέθοδοι εξομάλυνσης σε μοντέλα παλινδρόμησης και ταξινόμησης, γενικευμένοι βαθμοί ελευθερίας, συναρτήσεις spline και συναρτήσεις kernel, νευρωνικά δίκτυα, ταξινομητές support vector, ανάλυση κατά συστάδες, ανάλυση σε κύριες συνιστώσες, δέντρα αποφάσεων και τυχαία δάση.

Επίσης θα μπορεί να σχεδιάζει και να προγραμματίζει αλγορίθμους για την υλοποίηση μεθόδων μηχανικής μάθησης σε γλώσσες προγραμματισμού python ή/και R.

Περιεχόμενο μαθήματος

  1. Επιβλεπόμενη μάθηση

Αλγόριθμοι κατηγοριοποίησης και παλινδρόμησης

Μέθοδοι εξομάλυνσης ridge/lasso regression

Αναπτύγματα συναρτήσεων βάσης και συναρτήσεις splines

Εξομάλυνση με συναρτήσεις kernels

Κριτήρια επιλογής μοντέλου, μεροληψία και διασπορά.

Support Vector Machines

Νευρωνικά Δίκτυα

  1. Μη επιβλεπόμενη μάθηση

Κανόνες συσχέτισης.

Ανάλυση κατά συστάδες.
Ανάλυση σε κύριες συνιστώσες και μέθοδοι μείωσης διάστασης δεδομένων.

Σύνθεση μοντέλων και τυχαία δάση.