Fälle auswählen - Ergebnis reproduzieren

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
DrHoppe
Beiträge: 4
Registriert: 11.03.2010, 16:42

Fälle auswählen - Ergebnis reproduzieren

Beitrag von DrHoppe »

Hallo,

Problem ist folgendes. Ich habe hier einen Datensatz mit knapp 1000 Daten, aus dem ich per Zufallsauswahl 100 Fälle ausgewählt habe. So weit, so schön. Danach folgt die Auswertung, auch alles noch kein Problem.

Mein Problem tritt nun aber an der Stelle auf, dass ich beim nächsten Starten von SPSS aus den 1000 Daten gerne wieder genau die gleichen 100 Fälle auswählen würde, um mit der richtigen Stichprobe weiterzuarbeiten. Dabei will ich allerdings kein neues Datenblatt erstellen, sondern die 1000 Daten sollen schon weiterhin in der Datei bestehen bleiben.

Ich dachte, ich könnte das irgendwie hinkriegen, indem ich über Transformieren -> Zufallsgeneratoren -> Startwert festlegen einen Startwert festlege und damit dann beim nächsten Mal, wenn ich wieder per Zufallsauswahl 100 Fälle ziehen will, den gleichen Startwert vorher festlege, auch die gleichen 100 Fälle ausgewählt bekomme. Aber das scheint nicht der Fall zu sein. (Beispiel: Beim ersten Ziehen hatte ich durch Zufall keinen einzigen Fall mit missing value erwischt, beim zweiten Ziehen waren dann aber 2 dabei, was natürlich die Auswertung vom ersten Ziehen über den Haufen wirft)

So müsste ich quasi, um die neuen Auswertungen machen zu können, die alten nochmal komplett mitmachen, damit sich die Auswertung auf die gleichen Fälle bezieht. Ziemlich unpraktisch und hoffentlich nicht Sinn der Sache.

Wenn mir da jemand weiterhelfen könnte, der mir sagt, wie ich konkret die gleichen Fälle bei der Zufallsauswahl wieder kriege, die ich auch beim ersten Mal hatte, wäre mir mehr als geholfen.
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

bei der auswahl wird eine filtervariable erzeugt. die (bzw. die datei) speicherst du, ggf. wird die filtervariable umbenannt, damit ein späterer filter diese variable nicht überschreibt. anschliessend kannst über menü: daten, fälle auswählen... mit hilfe dieser variablen immer dieselbe zufallsstichprobe auswählen.

ob man die allererste auswahl rekonstruieren kann: früher gab es eine journaldatei mit dem namen spss.jnl. dort wurde jede analyse aufgezeichnet. möglicherweise auch, wie der filter erstellt wurde. falls dies zu finden wäre, kann man die syntax von dort in ein neues syntax-fenster kopieren und ausführen.
DrHoppe
Beiträge: 4
Registriert: 11.03.2010, 16:42

Beitrag von DrHoppe »

Danke für den Tipp.
Ich hab nun mal in der Journal Datei nachgeschaut, aber leider das gleiche Problem, das ich aktuell auch schon habe. Egal, was ich versuche ich kriege meine allererste Auswahl nicht mehr rekonstruiert, sondern eine andere Auswahl.
Immerhin ist diese Auswahl aber dann immer identisch, dh es werden auch beim x-ten Versuch noch die gleichen Fälle ausgewählt wie bei den vorherigen.

Inzwischen zweifel ich echt auch an mir, wie ich heute morgen die Stichprobe gezogen habe, dass ich da diese Werte bekommen habe und sie nun nicht mehr hinkriege. Ich hab schon zig Mal den Startwert in der Syntaxdatei abgeglichen, aber den hab ich immer gleich gewählt.

Ich denke, ich werde nun dann eben die ersten Auswertungen für diese neue Fallauswahl, die ich selber reproduzieren kann, nochmal fahren. Dadurch verliere ich zwar die Ergebnisse und Analysen von heute, aber immerhin muss ich dann nicht rumtricksen, um wieder an die gleichen Fälle zu kommen.

Es sei denn jemand hat noch eine alternative Idee, wie ich meine erste Zufallsauswahl zurückbekomme.

Trotzdem nochmal Danke für den Tipp mit dem Journal, da hatte ich ganz vergessen nachzusehen.


Edit:Es ist schon recht peinlich, das zugeben zu müssen, aber ich hab das Problem nun endlich lösen können. Scheinbar hatte ich den Datensatz irgendwann zwischendurch falsch abgespeichert und dadurch eine 2. Daten-Datei mit identischem Namen, mit der ich dann auch entsprechend gearbeitet und gespeichert habe. Ums kurz zu machen: Zufallsauswahl auf die Datei, in der ich schon zwischendurch gespeichert hatte = falsche Fallauswahl; unbearbeiteter (zum Glück noch vorhandene) original Datensatz mit Zufallsauswahl = es werden die gleichen Fälle ausgewählt wie beim ersten Mal.

Ich halte es da bezüglich SPSS mit einem Simpsonszitat: Es ist mein erster Tag :roll:
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten