Doppelte Fälle erkennen

Beitrag von **BananaJoe** » 23.11.2009, 15:27

Hallo Leute

Bisher hatte ich nur Auswertungen zu erledigen im SPSS. Nun muss ich erstmals Daten erheben und eingeben. Natürlich :) folgen schon die ersten Probleme.

Folgendes Szenario:
Ich habe einen Datensatz der mehrere Fragebögen beinhaltet. Diese werden zu verschiedenen Zeitpunkten eines Prozesses erhoben. Es kann aber sein, dass dieselbe Person 2 oder 3 mal den Prozess durchläuft.

Frage 1:
Ich möchte dass, wenn ich die ID-Nummer eingebe, automatisch in einer weiteren Variable angegeben wird der wievielte Durchlauf es ist. Es soll also durch die ID-Nummer erkennen, dass die Person schon mal erfasst wurde und bei der Variable "Durchlauf" z.b. eine "2" erscheinen. Wie kann ich das beim erstellen der Datenmatrix so definieren?

Frage 2:
Super wäre es dann noch, wenn es die Fallzahl nicht beinflussen würde. d.h. auch bei 3 Durchläufen, es immer noch als ein Fall gewertet wird.

Vielen Dank und beste Grüsse
BananaJoe

Beitrag von **KarinJ** » 23.11.2009, 15:59

frage 1: standardmässig geht das in spss nicht. möglicherweise könnte jemand z.b. ein vb-script schreiben, ich aber nicht. man könnte wahrscheinlich nach der dateneingabe eine syntax schreiben, die doppelte fälle in einer variablen nummeriert. allerdings hab ich keine motivation, das herauszupuzzeln.

frage 2: grundsätzlich sollte man daten eines falles nicht in separate zeilen schreiben, sondern als spalten in die gleiche zeile. ich würde mir vor der dateneingabe gedanken machen, was ich auswerten will, d.h. welche tests und wie die in spss funktionieren. sonst steht man am ende da und kann die ganze datei umschaufeln.

Beitrag von **georggraph** » 25.11.2009, 07:37

Hallo,

zu Frage 1: ein automatisches Erzeugen eines Variableneintrags (in Deinem Fall der Variable "Durchlauf") geht meines Wissens mit den üblichen SPSS-Bordmitteln nicht (mit Scripts kenne ich mich nicht aus).
Du könntest aber die folgende Syntax ausführen, die die Erzeugung der Variablen vornimmt:

Code: Alles auswählen

COMPUTE x = $CASENUM.
SORT CASES BY id x.
IF id <> LAG(id) Durchlauf = 1.
IF $CASENUM = 1 Durchlauf = 1.
EXE.
IF id = LAG(id) Durchlauf = LAG(Durchlauf) + 1.
SORT CASES BY x.
DELETE VAR x.

Bei Frage 2 muss ich Karin Recht geben, ich hätte es auch bei einem Fall pro Zeile belassen und stattdessen für jeden Durchlauf neue Variablen hinten an die Datei hinzugefügt.

Beste Grüße,
georggraph

Beitrag von **KarinJ** » 25.11.2009, 09:44

super, den code merk ich mir.