Fälle ausschliessen - aber komplexer!

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Fribi
Beiträge: 8
Registriert: 08.08.2011, 20:37

Fälle ausschliessen - aber komplexer!

Beitrag von Fribi »

Hallo zusammen,

wir sind zurzeit an unserer Master-Arbeit und haben - obwohl soeben mit der Statstik begonnen - ein Problem. Wir verwenden das Schweizer Haushaltspanel, wobei es 1. ein Datenfile mit den Haushalten und 2. eines mit den Angaben zu den im Haushalt wohnhaften Personen gibt. Nachdem wir nun die beiden Files gepoolt haben, stehen wir vor folgendem Problem:

Wir müssten alle Haushalte ausschliessen, in denen eine Person wohnt, die über 64 Jahre alt ist. Gleichzeitig möchten wir alle Personen im Haushalt unter 18 Jahren rausschmeissen, da uns nur die Eltern (Paare) interessieren, und die Kinder haben wir in einer Variable bei den Eltern sowieso miterfasst.

Dass man in SPSS unter "Fälle auswählen" -> "Falls Bedingung zutrifft" definieren kann, wer rausfliegen soll, das haben wir mittlerweile verstanden. Das Problem ist aber, dass dann nur die einzelne Person und nicht der gesamte Haushalt ausgeschlossen wird.

Wie kann man also SPSS mitteilen, dass wenn bspw. Person1 rausfliegt, auch Person2 und Person3, die mit Person1 in Haushalt1 wohnen, rausfliegen müssen? Sonst bleiben uns diese Personen nämlich im File...

Wenn jemand eine Antwort auf diese Frage hätte, wären wir unglaublich froh, denn sonst können wir nicht einmal unser Datenfile bereinigen :?

Danke schon im Voraus!!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

so komplex ist das nicht.

Da die Datensätze ja schon getrennt vorliegen, besteht eine Lösungsmöglichkeit darin, diejenigen Personenkennziffern zu identifizieren, die gezogen werden sollen. Ohne Kenntnis des Datensatzes ist das etwas improvisiert: Es wird eine Liste der PKZ als Schlüsselvariable generiert, die die gewünschten Eigenschaften besitzt. Dann wird diese Liste mit der Urliste gematched (PKZ müssen sortiert sein). Dann diejenigen löschen, die nicht gematched sind. Bei der Schlüssel-Tabelle darauf achten, dass keine PKZ doppelt vorhanden sind (ggf. Dialog "doppelte Fälle ermitteln" einsetzen).


Gruß
drfg2008
Fribi
Beiträge: 8
Registriert: 08.08.2011, 20:37

Beitrag von Fribi »

Danke für deine Antwort, aber das hilft uns leider nicht weiter. Denn wenn wir die Person1 im Personenfile rausschmeissen, werden Person2 und Person3 trotzdem stehenbleiben, somit ist Haushalt1 immer noch im gepoolten File enthalten.

Vielleicht müssen wir hier noch anfügen, dass es sich dabei um ein File mit rund 10'000 Personen bzw. 3000 Haushalten handelt. D.h. von Hand wäre die ganze Arbeit unglaublich zeitraubend...

Wenn wir den gematchten Datensatz (d.h. Haushalts- und Personendaten) betrachten, wie können wir per Syntax (wahrscheinlich am einfachsten) HAUSHALTE rausschmeissen, wenn eine Bedingung auf EINE Person in diesem Haushalt zutrifft?? Gleiches müssten wir nämlich auch noch mit andern Variablen (bspw. Rentenbezüger etc.) durchführen. Also: Wenn eine Person im Haushalt eine Rente bezieht, fliegt der gesamte Haushalt aus dem File und nicht nur die rentenbeziehende Person...

Wie macht man das?

HILFE!

Danke für Antworten
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Ja, wie sieht die Datendatei denn nun aus? Jeder Haushalt hat mehrere Zeilen, nämlich für jedes Mitglied eine separate Zeile? In dem Falle könntet Ihr "Daten Aggregieren" benutzen. Break-Variable wäre die Haushalts-Kennung, und die neu zu bildende Variable könnte enthalten "Prozent der Fälle innerhalb eines Haushaltes mit Alter > 64". Diese Prozenwert würde für alle Zeilen eines jeden Haushaltes angegeben und kann als Filterbedingung benutzt werden.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Danke für deine Antwort, aber das hilft uns leider nicht weiter. Denn wenn wir die Person1 im Personenfile rausschmeissen, werden Person2 und Person3 trotzdem stehenbleiben, somit ist Haushalt1 immer noch im gepoolten File enthalten.
nicht richtig. Ich habe das als PKZ bezeichnet, was eine Haushaltskennziffer beinhalten (!) muss. Wenn also eine Person ein Merkmal aufweist, das zum Ausschluss des ganzen Haushalts (mit mehreren Einzelpersonen) führt, muss über eine Schlüsselvariable / PKZ / Haushaltskennziffer (wie immer man das nennen will) das geregelt werden.

Beispiel: Person 1 hat PKZ 111-02. PKZ besteht aus Haushalt 111 und die Person 02. Entfernt werden sollen alle Personen mit 111. Also: 111-01, 111-02, 111-03, ... usw. Wie das im Schweizer Panel gelöst ist, entzieht sich meiner Kenntnis. Ohne Kenntnis des Datensatzes ist keine genaue Lösung zu finden.

Gruß
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten