Fälle auswählen - Ein komplzierter Fall

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Leni2010
Beiträge: 6
Registriert: 03.03.2010, 01:53

Fälle auswählen - Ein komplzierter Fall

Beitrag von Leni2010 »

Hallo,

ich sitze schon einige Zeit vor dem Rätsel, wie ich für mein Vorhaben Fälle auswählen kann und hoffe, dass mir hier jemand helfen kann.
Ich beschreibe das Problem kurz:
Ich habe einen Datensatz, indem Daten zu Patienten und ihren Kindern erfasst sind. Die Patienten und die Kinder einer Familie habe in der Matrix die gleiche ID erhalten. Allerdings wurden immer nur für das älteste Kind die Angaben zu den Eltern gemacht, um sich Arbeit zu sparen, da alle Kinder einer Familie ja die gleichen Angaben zu den Eltern haben. In der Spalte des jüngeren Kindes, welches aber die gleiche ID hat, "fehlen" also die Angaben und SPSS liest sie als Missings. Wenn ich mir nun Häufigkeiten zu Elternvariablen ausgeben lasse, zählt er also die Angaben des jüngeren Kindes als missing, obwohl es ja kein missing gibt.
Ich habe in der Funktion "Fälle auswählen - if cases" schon viel rumprobiert, aber ich bin auf noch keine Bedingung gekommen, die mein Problem löst. ich kann ja sicher nicht sagen, dass immer nur die erste Person mit z.B. der ID3 ausgwählt werden soll o.ä.

Puh, ich finde das super kompliziert, aber die Fälle müssen irgendwie raus, damit sie weder als missings auftauchen noch kann ich sie für alle Kinder derselben ID nachtragen, da sonst die Eltern doppelt gezählt werden. :roll:

Ich hoffe, dass meine Frage einigermaßen verständlich ist und hoffe, das jemand einen Tipp für mich hat.

Erstmal liebe Grüße
Leni2010
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

die kinder haben doch sicher alle weitere variablen außer den elternvariablen. also kann man sie nicht löschen und muss mit den missings leben. da häufigkeitstabellen aber auch "valid percent" ausgeben, hat man eigentlich mit missings kein problem, weil man die anteile sowohl auf der basis der gesamtstichprobe als auch der stichprobe minus missing bekommt.

um fälle auszuwählen, die missing haben oder nicht, kann man die funktion nmiss = anzahl missings gebrauchen:

if nmiss(var) = 0 --> fall muss einen wert haben
if nmiss(var) = 1 --> fall muss leer sein

in der klammer kann auch eine reihe von variablen stehen (mit komma getrennt) und man erhöht dann ggf. die anzahl.
Leni2010
Beiträge: 6
Registriert: 03.03.2010, 01:53

Beitrag von Leni2010 »

Vielen Dank für die schnelle Antwort.

Ja genau, die kann man nicht einfach löschen, weil dann die Kindervariablen, die dann für alle ausgefüllt sind, weg wären.

Aber bei den valid missings weiss ich dann doch nicht, ob der Wert dadurch zustande gekommen ist, dass er tatsächlich fehlt oder dadurch, dass sie nur einmal für eine Familie eingetragen wurden, oder?
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

valid missings gibt es nicht. valid percent sind prozentanteile der fälle, die einen wert haben. ob das dann tatsächlich nur die sind, die du haben willst, ist eine andere frage z.b. ob du sicher sein kannst, dass wirklich nur das älteste kind eingetragen wurde und nicht vielleicht doch noch ab und an ein jüngeres.

wenn es nun darum geht, ob fehlende fälle ein jüngeres kind sind oder ein ältestes kind, bei dem keine angaben gemacht wurden, dann muss man sich etwas überlegen, um das älteste kind zu kennzeichnen. wie genau das gehen könnte, weiß ich nicht. das hängt von den daten ab. wenn es nicht zu viele fälle sind, dann könnte man nach ID und alter sortieren und jeweils dem ältesten kind in einer neuen variablen per hand eine 1 geben. dann könnte man anschliessend eine kreuztabelle aus dieser variablen erstellen und der interessierenden variablen, um zu sehen, wieviel echte missing es gibt.
Leni2010
Beiträge: 6
Registriert: 03.03.2010, 01:53

Beitrag von Leni2010 »

Ja, ich hatte auch schon überlegt die IDs zu verändern. Z.B. habe ich versucht and die Zahlen Buchstaben zu hängen. Also: ältestes Kind z.B. 1jüngere Kinder dann 1a, 1b usw. Das hat SPSS aber immer wieder gelöscht.
Liegt das an den Buchstaben?

Wenn ich es noch irgendwie schaffe die IDs zu ändern, wie müsste dann der Befehl lauten, um bestimmte IDs auszuwählen. Da müsste ja sowas wie: nur Fälle auswählen wenn ID ohne Buchstaben oder sowas ähnliches, oder?
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

die fälle 1a zu nennen ist keine gute idee. besser wäre es, die kinder 1 = ältestes, und 2 = jüngere zu nennen (oder genauer: zahl = geschwisterfolge z.b. erstes = 1, zweites = 2, drittes = 3). dann kann man "fälle auswählen" if variable = 1.

wenn man will, kann man anschliessend immer noch eine kombination aus ID und geschwisterreihenfolge errechnen.

1a etc. kann man nur in variablen im string-format eingeben.
Leni2010
Beiträge: 6
Registriert: 03.03.2010, 01:53

Beitrag von Leni2010 »

Habe jetzt eine weitere Variable eingefügt und diese Geschwisterreihenfolge (1-4) genannt. Somit konnte ich nun alle Fälle auswählen, die eine 1 (für erstes Kind) haben. Super! Vielen Dank!

Kann man das auch irgendwie spreichern? Bislang hat SPSS die Fälle immer wieder zugefügt, wenn ich den Datensatz geschlossen habe. Oder speicher ich einfach die Syntax und lasse die dann jedes Mal bevor ich rechne laufen?
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

die auswahl wird mit dem schliessen der datei immer deaktiviert. die syntax der auswahl kann man aber speichern: statt ausführen (ok) einfügen drücken und dann syntax speichern.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten