Επιστήμη Δεδομένων Υγείας ΙΙ: Διαχείριση Ηλεκτρονικών Δεδομένων

Σκοπός του μαθήματος

Σκοπός του μαθήματος είναι η εξοικείωση των φοιτητών με τις πηγές ηλεκτρονικών δεδομένων υγείας και τις βασικές προκλήσεις που προκύπτουν κατά τη χρήση τους, συμπεριλαμβανομένων των ζητημάτων ηθικής, ποιότητας, διαμόρφωσης και διαχείρισης των δεδομένων.

Εκπαιδευτικοί στόχοι του μαθήματος

Μετά την επιτυχή ολοκλήρωση του μαθήματος οι φοιτητές θα είναι σε θέση να γνωρίζουν τις πηγές από τις οποίες μπορούν να εξαχθούν ηλεκτρονικά δεδομένα υγείας, τη διασύνδεση και διαχείριση τέτοιων δεδομένων καθώς και τις μεθόδους για τη δημιουργία συνόλων δεδομένων έτοιμων προς περαιτέρω στατιστική ανάλυση. Επίσης θα είναι εξοικειωμένοι με τα ρυθμιστικά πλαίσια διακυβέρνησης προσωπικών δεδομένων.

Περιεχόμενα μαθήματος

  • Εισαγωγή στις βασικές αρχές ιατρικής ακριβείας
  • Πηγές και συστήματα σχετικά με την επιστήμη δεδομένων υγείας στην Ελλάδα και το εξωτερικό (συμπεριλαμβανόμενων των ηλεκτρονικών αρχείων υγείας)
  • Εφαρμογή βασικών επιδημιολογικών σχεδιασμών μελετών (προοπτικές, κλινικές δοκιμές και άλλες) σε ηλεκτρονικά δεδομένα υγείας
  • Βασικές έννοιες ελεγχόμενων κλινικών ορολογιών και ιατρικών οντοτήτων για την καταγραφή της διάγνωσης, των φαρμάκων και των εργαστηριακών μετρήσεων και διαδικασιών, για παράδειγμα ICD-10, SNOMED-CT, και άλλα
  • Δεοντολογικά ζητήματα και διαδικασίες, συμπεριλαμβανόμενων της ιδιοκτησίας δεδομένων, της συναίνεσης, της δεοντολογίας των αλγορίθμων και των σχετικών μηχανισμών για τη διακυβέρνηση των δεδομένων (data governance). Διακυβέρνηση πληροφοριών, ανωνυμοποίηση, απόρρητο και σχετικά ρυθμιστικά πλαίσια (π.χ. GDPR)
  • Ζητήματα ποιότητας δεδομένων που συλλέγονται τακτικά όπως για παράδειγμα κωδικοποίηση/δυσταξινόμηση, πιθανολογική και ντετερμινιστική σύνδεση (linkage) δεδομένων, ελλείπουσες τιμές.
  • Δημιουργία συνόλων δεδομένων για ανάλυση από ηλεκτρονικά αρχεία υγείας χρησιμοποιώντας διάφορους σχεδιασμούς μελετών, δημιουργία και χρήση καταλόγου κωδικών (codelist), δημιουργία και αξιολόγηση φαινοτυπικών αλγορίθμων, μέτρηση των εκθέσεων, των εκβάσεων και των συμμεταβλητών συμπεριλαμβανόμενων και των δεδομένων έκθεσης σε φάρμακα και την ταξινόμηση ICD-10.
  • Διαχείριση δεδομένων (data wrangling και data cleaning).
  • Κύριες πηγές μεροληψίας σε ηλεκτρονικά μητρώα υγείας
  • Παραδείγματα εποπτευόμενης και μη εποπτευόμενης μηχανικής μάθησης και τεχνητής νοημοσύνης για έρευνες σε ηλεκτρονικά μητρώα υγείας συμπεριλαμβανομένων της επεξεργασίας της φυσικής γλώσσας και των ιατρικών απεικονίσεων
  • Δεξιότητες μηχανικής λογισμικού για πρόσβαση στα δεδομένα, οργάνωση της ανάλυσης και για να καταστούν οι αναλύσεις αυτές κοινοποιήσιμες και αναπαραγώγιμες
  • Μηχανισμοί για τη διασφάλιση ασφαλούς πρόσβασης συμπεριλαμβανόμενου αξιόπιστου περιβάλλοντος έρευνας
  • Βέλτιστες πρακτικές για αποθήκευση, διαχείριση και ανάλυση μεγάλων και σύνθετων συνόλων δεδομένων.

Μέθοδοι διδασκαλίας

Το περιεχόμενο του μαθήματος καλύπτεται σε 13 4-ωρες διαλέξεις μικτού τύπου (θεωρία-εφαρμογή) στις οποίες διδάσκεται ταυτόχρονα η θεωρία και εφαρμόζεται με παραδείγματα σε Η/Υ.  Στους φοιτητές ανατίθενται σχετικές εργασίες κατά τη διάρκεια του μαθήματος.