Doppelte Fälle erkennen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
BananaJoe
Beiträge: 6
Registriert: 23.11.2009, 15:15

Doppelte Fälle erkennen

Beitrag von BananaJoe »

Hallo Leute

Bisher hatte ich nur Auswertungen zu erledigen im SPSS. Nun muss ich erstmals Daten erheben und eingeben. Natürlich :) folgen schon die ersten Probleme.

Folgendes Szenario:
Ich habe einen Datensatz der mehrere Fragebögen beinhaltet. Diese werden zu verschiedenen Zeitpunkten eines Prozesses erhoben. Es kann aber sein, dass dieselbe Person 2 oder 3 mal den Prozess durchläuft.

Frage 1:
Ich möchte dass, wenn ich die ID-Nummer eingebe, automatisch in einer weiteren Variable angegeben wird der wievielte Durchlauf es ist. Es soll also durch die ID-Nummer erkennen, dass die Person schon mal erfasst wurde und bei der Variable "Durchlauf" z.b. eine "2" erscheinen. Wie kann ich das beim erstellen der Datenmatrix so definieren?

Frage 2:
Super wäre es dann noch, wenn es die Fallzahl nicht beinflussen würde. d.h. auch bei 3 Durchläufen, es immer noch als ein Fall gewertet wird.

Vielen Dank und beste Grüsse
BananaJoe
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

frage 1: standardmässig geht das in spss nicht. möglicherweise könnte jemand z.b. ein vb-script schreiben, ich aber nicht. man könnte wahrscheinlich nach der dateneingabe eine syntax schreiben, die doppelte fälle in einer variablen nummeriert. allerdings hab ich keine motivation, das herauszupuzzeln.

frage 2: grundsätzlich sollte man daten eines falles nicht in separate zeilen schreiben, sondern als spalten in die gleiche zeile. ich würde mir vor der dateneingabe gedanken machen, was ich auswerten will, d.h. welche tests und wie die in spss funktionieren. sonst steht man am ende da und kann die ganze datei umschaufeln.
georggraph
Beiträge: 114
Registriert: 30.03.2009, 09:39

Beitrag von georggraph »

Hallo,

zu Frage 1: ein automatisches Erzeugen eines Variableneintrags (in Deinem Fall der Variable "Durchlauf") geht meines Wissens mit den üblichen SPSS-Bordmitteln nicht (mit Scripts kenne ich mich nicht aus).
Du könntest aber die folgende Syntax ausführen, die die Erzeugung der Variablen vornimmt:

Code: Alles auswählen

COMPUTE x = $CASENUM.
SORT CASES BY id x.
IF id <> LAG(id) Durchlauf = 1.
IF $CASENUM = 1 Durchlauf = 1.
EXE.
IF id = LAG(id) Durchlauf = LAG(Durchlauf) + 1.
SORT CASES BY x.
DELETE VAR x.
Bei Frage 2 muss ich Karin Recht geben, ich hätte es auch bei einem Fall pro Zeile belassen und stattdessen für jeden Durchlauf neue Variablen hinten an die Datei hinzugefügt.

Beste Grüße,
georggraph
"Ein kaum merkliches Kopfnicken verriet dann, dass er nicht die Absicht habe, diese Frage zu beantworten, und es war Sache des Fragestellers, seinen eigenen Fehler zu erkennen und die Frage neu zu formulieren." (F.Kafka: Der Verschollene)
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

super, den code merk ich mir. :D
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten