Ανάλυση Δεδομένων με Ελλειπούσες Τιμές

 

Περιεχόμενο μαθήματος

 

Μέρος 1o: Προβλήματα που εμφανίζονται κατά την ανάλυση μελετών με ελλείπουσες τιμές. Εισαγωγή στις διαθέσιμες μεθοδολογικές προσεγγίσεις.

Πραγματικά δεδομένα, δεδομένα με ελλείπουσες τιμές, πλήρη δεδομένα. Παραδείγματα:

(α) Δειγματοληπτικές έρευνες

(β) Επιδημιολογικές έρευνες

(γ) Κλινικές Δοκιμές

Ειδικές δομές με ελλείπουσες τιμές: υποδείγματα με ελλείπουσες τιμές μονοτονικής μορφής

Προσχεδιασμένες συγκριτικά με τυχαίες ελλείπουσες τιμές.

Μηχανισμοί παραγωγής ελλειπουσών τιμών: τελείως τυχαίες, τυχαίες, μη αγνοήσιμες ελλείπουσες τιμές.

Εισαγωγή στις στρατηγικές ανάλυσης δεδομένων με ελλείπουσες τιμές: εγκυρότητα συμπερασμάτων και υπολογιστικά προβλήματα.

(α) Ανάλυση δεδομένων με πλήρεις παρατηρήσεις

(β) Ανάλυση όλων των διαθέσιμων δεδομένων

(γ) Μέθοδοι συμπλήρωσης ελλειπουσών τιμών

  1. i) Hot-deck μέθοδος
  2. ii) Μέθοδος παλινδρόμησης

iii) Μέθοδος πολλαπλών συμπληρώσεων

(δ) Ανάλυση σταθμισμένων δεδομένων

(ε) Ανάλυση βασισμένη στη πιθανοφάνεια

  1. i) Μοντέλα βασισμένα στον τρόπο επιλογής
  2. ii) Μοντέλα βασισμένα στη μίξη διαφορετικών υποπληθυσμών

 

Μέρος 2o: Παραμετρικές μέθοδοι ανάλυσης δεδομένων με τυχαίες ελλείπουσες τιμές.

Μέθοδοι ανάλυσης δεδομένων με μονοτονικής μορφής ελλείπουσες τιμές: SWEEP operator.

Αλγόριθμος EM (Estimation – Maximazation).

(α) Τρόπος παραγωγής

(β) Εφαρμογή σε υποδείγματα από την οικογένεια εκθετικών κατανομών.

(γ) Εκτίμηση της διακύμανσης

(δ) Πραγματική συγκριτικά με ελλείπουσα πληροφορία

(ε) Ρυθμός σύγκλισης του αλγόριθμου.

Ελλείπουσες τιμές σε πίνακες συνάφειας

(α) Εκτιμητές μέγιστης πιθανοφάνειας σε υποδείγματα γραμμικά στη λογαριθμική κλίμακα.

 

Μέρος 3o: Ημιπαραμετρικές μέθοδοι ανάλυσης δεδομένων με ελλείπουσες τιμές.

Αντίστροφη πιθανότητα αποκοπής σταθμισμένων εκτιμητών σε:

(α) Πολλαπλή παλινδρόμηση

  1. i) Με ελλείπουσες τιμές στην εξαρτημένη μεταβλητή
  2. ii) Με ελλείπουσες τιμές στις ανεξάρτητες μεταβλητές

(β) Γενικευμένα Γραμμικά Μοντέλα

  1. i) Με ελλείπουσες τιμές στην εξαρτημένη μεταβλητή
  2. ii) Με ελλείπουσες τιμές στις ανεξάρτητες μεταβλητές

(γ) Σε μοντέλα εξισώσεων γενικευμένης εκτίμησης (GEE: Generalized estimated equations) για την ανάλυση πολλαπλών ανά μονάδα μετρήσεων.

(δ) Σε μοντέλα παλινδρόμησης Cox (παλινδρόμησης δεδομένων επιβίωσης) με ελλείπουσες τιμές στις ανεξάρτητες μεταβλητές.

 

Μέρος 4o: Ανάλυση δεδομένων με μη-αγνοήσιμους μηχανισμούς μη-απάντησης (απόκρισης).

Παραμετρική ανάλυση: Υπολογιστικές δυσκολίες και έλλειψη ανθεκτικών εκτιμητών μεγίστης πιθανοφάνειας.

Ημιπαραμετρική ανάλυση: Αντίστροφη πιθανότητα αποκοπής σταθμισμένων εκτιμητών. Προβλήματα ταυτοποίησης και σύγκλισης με ρυθμό ανάλογο του

Έλλειψη ταυτοποίησης στα μη παραμετρικά μοντέλα με μη-αγνοήσιμο μηχανισμό μη-απάντησης. Προσέγγιση στη βάση της ανάλυσης ευαισθησίας.

Μέθοδοι διεξαγωγής ανάλυσης ευαισθησίας σε μη-παραμετρικά μόλις ταυτοποιήσιμα μοντέλα.

Ανάλυση ερευνών με διαχρονική παρακολούθηση των ατόμων που δεν απάντησαν.

(α) Με επαναλαμβανόμενες προσπάθειες προσέγγισης όλων των ατόμων που συστηματικά αρνούνται να απαντήσουν.

(β) Με προσπάθειες προσέγγισης τυχαίου δείγματος των ατόμων που συστηματικά αρνούνται να απαντήσουν.

 

3. ΜΑΘΗΜΑΤΑ ΕΠΙΛΟΓΗΣ ΚΑΤΗΓΟΡΙΑΣ ΙΙ (2 ECTS). Παρουσιάζονται όσα μαθήματα έχουν διδαχτεί μια ή περισσότερες φορές. Η ΕΔΕ διατηρεί το δικαίωμα να εισαγάγει και άλλα μαθήματα επιλογής ανάλογα με τις εξελίξεις της επιστήμης.