Hallo,
ich habe mit SPSS 19 fünf Datensätze mit imputierten Werten erzeugt. Eigentlich müsste man diese fünf Datensätze ja jetzt poolen. In der SPSS-Hilfe wird leider nirgens erklärt, wie man das konkret macht. Kennt sich da jemand aus? Gehen beim Poolen Stringvariablen verloren (eigentlich sind die ja in allen parallelen Datensätzen gleich)?
Beste Grüße
Uhlnspeegel
Zusammenführen der Daten nach multipler Imputation?
-
Uhlnspeegel
- Beiträge: 26
- Registriert: 13.03.2012, 16:52
-
Uhlnspeegel
- Beiträge: 26
- Registriert: 13.03.2012, 16:52
Ok, da habe ich mich vieleicht falsch ausgedrückt.
Bei der multiplen Imputation spuckt SPSS ja eine anzahl von Datensätzen aus, bei denen die fehlenden Werte jeweils durch (von Datensatz zu Datensatz unterschiedliche) für Variable und Fall wahrscheinliche Werte ersetzt werden. Praktisch sieht das dann so aus, dass in einem Datenblatt oben der Originaldatensatz (der mit den Missings) steht, gekennzeichnet dadurch, dass die neu erzeugte Variable "Imputation" gleich 0 ist. Darunter stehen die 5 vervollständigten Datensätze, gekennzeichnet unter "Imputation" durch 1 bis 5.
Nun kann ich ja mit 5 Datensätzen schlecht weiterrechnen. Ich muss also diese 5 Datensätze zusammenfügen, wobei, wenn ich das Prinzip der multiplen Imputation richtig verstanden habe, für jedes Datum der Mittelwert über die 5 Datensätze gebildet wird. Die schon im Originaldatensatz vorhandenen Daten sind ja in allen 5 Datensätzen gleich, sodass sich an ihnen nichts ändert. Nur die Missings werden durch den Mittelwert aus den 5 imputierten Werten ergänzt.
Meine Frage ist jetzt also, wie ich SPSS dazu bringe, die 5 Datensätze Fall für Fall zu mitteln. Oder liege ich mit meinem Vorgehen schon vom Prinzip her falsch?
Bei der multiplen Imputation spuckt SPSS ja eine anzahl von Datensätzen aus, bei denen die fehlenden Werte jeweils durch (von Datensatz zu Datensatz unterschiedliche) für Variable und Fall wahrscheinliche Werte ersetzt werden. Praktisch sieht das dann so aus, dass in einem Datenblatt oben der Originaldatensatz (der mit den Missings) steht, gekennzeichnet dadurch, dass die neu erzeugte Variable "Imputation" gleich 0 ist. Darunter stehen die 5 vervollständigten Datensätze, gekennzeichnet unter "Imputation" durch 1 bis 5.
Nun kann ich ja mit 5 Datensätzen schlecht weiterrechnen. Ich muss also diese 5 Datensätze zusammenfügen, wobei, wenn ich das Prinzip der multiplen Imputation richtig verstanden habe, für jedes Datum der Mittelwert über die 5 Datensätze gebildet wird. Die schon im Originaldatensatz vorhandenen Daten sind ja in allen 5 Datensätzen gleich, sodass sich an ihnen nichts ändert. Nur die Missings werden durch den Mittelwert aus den 5 imputierten Werten ergänzt.
Meine Frage ist jetzt also, wie ich SPSS dazu bringe, die 5 Datensätze Fall für Fall zu mitteln. Oder liege ich mit meinem Vorgehen schon vom Prinzip her falsch?
-
Uhlnspeegel
- Beiträge: 26
- Registriert: 13.03.2012, 16:52



