Hallo!
Ich möchte gerne zum Ersetzen von fehlenden Werten in meinen kategorialen Daten eine Hot Deck Imputation durchführen.
Leider kenne ich mich nicht mit Syntaxbefehlen aus.
Wie kann ich SPSS nun sagen, dass es sich Variable 1-5 angucken soll und den fehlenden Wert in Variable 5 bei VPx mit dem Wert einer VPy ersetzen soll, die in Variable 1-4 identische Werte wie VPx hat? (hypothetisches Bsp.)
Vielen Dank im Voraus!!!
Hilfe bei Hot Deck Imputation
-
- Beiträge: 114
- Registriert: 30.03.2009, 09:39
Hallo dos,
bezogen auf Dein hypothetisches Beispiel, ginge das zum Beispiel wie folgt:
Zunächst kennzeichnet die Syntax alle Fälle mit einem Missing bei Var5.
Dann wird so sortiert, dass alle Fälle mit identischen Werten bei var1 bis var4 untereinander stehen.
Schließlich wird für Fälle mit Missings bei var5 der Wert der darüberliegenden Zeile genommen (LAG-Befehl), sofern die Werte bei var1 bis var4 übereinstimmen und die darüberliegende Zeile nicht auch ein Missing bei var5 hat.
Ist zwar ein wenig umständlich, dürfte aber zum Erfolg führen.
Ich hoffe, es ist verständlich, was ich meine.
Grüße,
georggraph
bezogen auf Dein hypothetisches Beispiel, ginge das zum Beispiel wie folgt:
Code: Alles auswählen
IF MISSING(var5) miss_v5 = 1.
SORT CASES BY var1 var2 var3 var4 miss_v5.
DO IF NOT(MISSING(miss_v5)).
IF var1 = (LAG(var1) & var2 = LAG(var2) & var3 = LAG(var3) & var4 = LAG(var4) & NOT(MISSING(LAG(var5)))) var5 = LAG(var5).
END IF.
EXE.
Dann wird so sortiert, dass alle Fälle mit identischen Werten bei var1 bis var4 untereinander stehen.
Schließlich wird für Fälle mit Missings bei var5 der Wert der darüberliegenden Zeile genommen (LAG-Befehl), sofern die Werte bei var1 bis var4 übereinstimmen und die darüberliegende Zeile nicht auch ein Missing bei var5 hat.
Ist zwar ein wenig umständlich, dürfte aber zum Erfolg führen.
Ich hoffe, es ist verständlich, was ich meine.
Grüße,
georggraph
"Ein kaum merkliches Kopfnicken verriet dann, dass er nicht die Absicht habe, diese Frage zu beantworten, und es war Sache des Fragestellers, seinen eigenen Fehler zu erkennen und die Frage neu zu formulieren." (F.Kafka: Der Verschollene)
-
- Beiträge: 4
- Registriert: 13.11.2008, 17:51
Danke erstmal für die schnelle und gut verständliche Antwort!
Ich werde deinen Vorschlag nacher ausprobieren und dann über Erfolg oder Misserfolg berichten.
Wenn jemand eine angemessener Methode kennt, Missings bei kategorialen Daten zu ersetzen, dann bin ich ganz Ohr.
Ich halte die HD-Methode für sinnvoll weil die Missings deterministisch und nicht durch ein Zufallsprinzip ersetzt werden.
Ich werde deinen Vorschlag nacher ausprobieren und dann über Erfolg oder Misserfolg berichten.
Wenn jemand eine angemessener Methode kennt, Missings bei kategorialen Daten zu ersetzen, dann bin ich ganz Ohr.
Ich halte die HD-Methode für sinnvoll weil die Missings deterministisch und nicht durch ein Zufallsprinzip ersetzt werden.