Hilfe bei Hot Deck Imputation

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
dos
Beiträge: 4
Registriert: 13.11.2008, 17:51

Hilfe bei Hot Deck Imputation

Beitrag von dos »

Hallo!

Ich möchte gerne zum Ersetzen von fehlenden Werten in meinen kategorialen Daten eine Hot Deck Imputation durchführen.
Leider kenne ich mich nicht mit Syntaxbefehlen aus.
Wie kann ich SPSS nun sagen, dass es sich Variable 1-5 angucken soll und den fehlenden Wert in Variable 5 bei VPx mit dem Wert einer VPy ersetzen soll, die in Variable 1-4 identische Werte wie VPx hat? (hypothetisches Bsp.)

Vielen Dank im Voraus!!!
georggraph
Beiträge: 114
Registriert: 30.03.2009, 09:39

Beitrag von georggraph »

Hallo dos,

bezogen auf Dein hypothetisches Beispiel, ginge das zum Beispiel wie folgt:

Code: Alles auswählen

IF MISSING(var5) miss_v5 = 1.
SORT CASES BY var1 var2 var3 var4 miss_v5.

DO IF NOT(MISSING(miss_v5)).
  IF var1 = (LAG(var1) & var2 = LAG(var2) & var3 = LAG(var3) & var4 = LAG(var4) & NOT(MISSING(LAG(var5)))) var5 = LAG(var5).
END IF.
EXE.
Zunächst kennzeichnet die Syntax alle Fälle mit einem Missing bei Var5.
Dann wird so sortiert, dass alle Fälle mit identischen Werten bei var1 bis var4 untereinander stehen.
Schließlich wird für Fälle mit Missings bei var5 der Wert der darüberliegenden Zeile genommen (LAG-Befehl), sofern die Werte bei var1 bis var4 übereinstimmen und die darüberliegende Zeile nicht auch ein Missing bei var5 hat.

Ist zwar ein wenig umständlich, dürfte aber zum Erfolg führen.

Ich hoffe, es ist verständlich, was ich meine.

Grüße,
georggraph
"Ein kaum merkliches Kopfnicken verriet dann, dass er nicht die Absicht habe, diese Frage zu beantworten, und es war Sache des Fragestellers, seinen eigenen Fehler zu erkennen und die Frage neu zu formulieren." (F.Kafka: Der Verschollene)
dos
Beiträge: 4
Registriert: 13.11.2008, 17:51

Beitrag von dos »

Danke erstmal für die schnelle und gut verständliche Antwort!

Ich werde deinen Vorschlag nacher ausprobieren und dann über Erfolg oder Misserfolg berichten.

Wenn jemand eine angemessener Methode kennt, Missings bei kategorialen Daten zu ersetzen, dann bin ich ganz Ohr.
Ich halte die HD-Methode für sinnvoll weil die Missings deterministisch und nicht durch ein Zufallsprinzip ersetzt werden.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten