Doktorandenkurs “Umgang mit fehlenden Daten”

Kursname: Umgang mit fehlenden Daten

Informationen: Der Kurs ist interdisziplinär ausgerichtet und kann von allen Promovierenden besucht werden, die im Studium zumindest Grundkenntnisse klassischer multivariater Datenanalyseverfahren (lineare / generalisierte lineare Modelle) erworben haben. Der Fokus des Kurses liegt auf der praktischen Anwendung. Statistische Grundlagen (z.B. Markov Chain Monte Carlo) werden nur insoweit behandelt, wie sie zum Verständnis der Methode und für die adäquate Anwendung der jeweiligen Verfahren notwendig ist.

Dozent: Dr. Kristian Kleinke, Uni Siegen, Department of Psychology

Datum: Montag, 04.03.2024 und Montag, 18.03.2024

Uhrzeit: 9.00 – 17.00 Uhr

Kursformat: Online-Seminar

Anmeldung: Email an meisterc@hsu-hh.de bis zum 02.03.2024

Weitere Kursinformationen:

Ablauf:

Am ersten Kurstag wird eine umfassende Einführung in die Problematik fehlender Werte bei der Analyse sozialwissenschaftlicher Datensätze gegeben. Verschiedene Ansätze zur Behandlung fehlender Werte werden vorgestellt und deren Vor- und Nachteile diskutiert.

Der Fokus des zweiten Kurstages ist die praktische Anwendung. Teilnehmende sind herzlich eingeladen, hier auch eigene Daten mitzubringen und an eigenen kleineren Problemstellungen zu arbeiten.

Zusätzlich besteht im Anschluss an den zweiten Kurstag noch die Möglichkeit, die begonnene Arbeit an einer konkreten Problemstellung weiterhin beratend zu begleiten.

Inhalte:

Tag 1

– Missing-data-Muster und Mechanismen

– Diagnostik selektiver Missing-Data-Prozesse

– Überblick über verschiedene Ansätze zur Behandlung fehlender Werte (u.a., ad hoc Verfahren, maximum likelihood, Gewichtung)

– Eine Einführung in die (Bayes’sche) Multiple Imputation (MI)

 

Tag 2: Praktische Anwendung

– MI unter Annahme multivariat normal verteilter Daten

– MI basierend auf (generalisierten) linearen Modellen

– MI bei Paneldaten

– robustere MI-Ansätze (wenn parametrische Annahmen verletzt sind)

Voraussetzungen:

– Grundkenntnisse in klassischen multivariaten Verfahren (lineare Modelle, generalisierte lineare Modelle

– Wünschenswert, aber nicht notwendig: R-Grundkenntnisse

Vorbereitung:

Um während des Kurses Zeit zu sparen, installieren Sie bitte vorab folgende Software:

1) Blimp, kostenlos erhältlich unter https://www.appliedmissingdata.com/blimp

Sollten Sie im Rahmen Ihres Promotionsvorhabens auch Modelle für Zähldaten spezifizieren wollen, dann müssten Sie bitte auch zusätzlich die Beta-Version installieren.

2) eine aktuelle R-Version, erhältlich unter https://cloud.r-project.org (für die Installation einiger Zusatzpakete benötigt man ggf. unter Windows auch die “R-tools”, die ebenfalls unter dieser Seite erhältlich sind)

3) Optional: Eine aktuelle Version von Rstudio (Desktop), kostenlos erhältlich unter https://posit.co/download/rstudio-desktop/

Sofern Sie auf Ihrem (Dienst-)Rechner keine Administratorenrechte haben sollten, bitten Sie Ihre Systemadministratoren vorab, o.g. Software zu installieren.

Literatur:

Als Begleitlektüre zum Kurs / zur Vertiefung werden folgenden Bücher empfohlen

1) Van Buuren, S. (2018). Flexible imputation of missing data (2nd ed.). CRC.

Das Buch ist kostenlos online lesbar unter: https://stefvanbuuren.name/fimd/

2) Enders, C. K. (2022). Applied missing data analysis (2nd ed.). Guilford.

3) Kleinke, K., Reinecke, J., Salfrán, D., & Spiess, M. (2020). Applied multiple imputation. advantages, pitfalls, new developments and applications in R. Springer.