Prädiktoren bestimmen für Gruppenbildung

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Ofreon
Beiträge: 4
Registriert: 03.05.2008, 21:58

Prädiktoren bestimmen für Gruppenbildung

Beitrag von Ofreon »

Hallo Zusammen :D

Also bei mir ist es nun auch so weit, ich muss grad meine Masterarbeit in Psychologie schreiben und darf dabei meine eigenen Lücken feststellen. Deshalb hoffe, dass Ihr mir mal in den nächsten 2 Monaten hier und da unter die Arme greifen könnt.

So ich stehe nun vor dem Problem, dass ich vor einem Datensatz sitze, mit ca. 80 Versuchspersonen zu 3 Messzeitpunkten (vor der Schwangerschaft, Geburt, nach der Schwangerschaft). Zu allen 3 Messzeitpunkten wurden sehr viele psychologische Masse und auch biochemische Masse (Cortisol) erhoben.

Konkret möchte ich nun schauen, welche Variabeln des 1 MZP auf z.B. die Einstellung der Mutter im 3 MZP (nach der Geburt) einen Einfluss ausüben und dabei sowohl psychologische als auch biochemische Paramter berrücksichtigen.

Mein erstes Problem ist, dass dieser Datensatz sehr "zerlöchert" ist. Heisst, nicht alle VP haben alle Tests durchgemacht und je nach Variabeln, die ich untersuchen möchte, schrumpft mein N dann bis auf sogar 20 VP runter, da nur diese alle Tests dann ausgefüllt haben. :roll:

Mein Ziel ist es jetzt Gruppen zum 1 MZP bilden zu können, welche unterschiedlich gut die Einstellung der Mutter im 3 MZP vorhersagen können.
Dafür habe ich jetzt einmal eine lineare Regressionsanalyse (stepwise) gerechnet, als AV die Einstellung genommen und als mögliche UV's alle Variabeln, die ich im ersten MZP so finden konnte. Dabei kamen auch schöne Modelle mit einem R-Square von >.9 heraus und nur ca. 5 verwendeten Variabeln (Welche Inhaltlich aber manchmal mehr als fragwürdig erschienen).

Mein Problem ist nun, dass wenn ich nun immer 75 % der Stichprobe zufällig auswähle um zu schauen, welche Variabeln die Einstellung der Mutter beeinflussen könnten, dass IMMER dabei hochsignifikante Modelle entstehen, mit aber immer unterschiedlichen UV darin. Das kann es doch nicht sein? (Hinweis: Als mögliche UV verwende ich ca. 30 Variabeln Nominal/Ordinal und Intervall)

Liegt das daran, dass Jeden Test nicht alle VP ausgefüllt haben? resp. dass es wohl einige Ausreisser geben muss?


Wie bekomme ich ein bisschen Ordnung in diesen Datensatz von ca. 1900 Variabeln, so dass ich schauen kann, welche UV zu MZP einen prädikativen Wert auf die AV im MZP 3 haben?

Hab mir auch schon überlegt, ob ich irgendwie mit einer Clusteranalyse dahinter soll, ...aber ich glaube es wäre erst einmal sinnvoller zu schauen, welche Variabeln überhaupt einen prädikativen Wert auf die AV haben. Was ich aber nicht kann, da ich ja immer andere Variabeln erhalte, alsbald ich andere 75 % der VP wähle.


Kann mir jemand helfen, dass ich zu vernünftigen Gruppen komme?

...und zu den Ausreisser und Missings ... gibt es eine "Gesamtfunktion" welche die Aussreisser und Missings irgendwie direkt im gesamten Datensatz "anzeigt"?

Für Hilfestellungen wäre ich super dankbar. Eigentlich möchte ich in einem 2,3,4 Schritt auch noch schauen, was für einen Einfluss die Geburt MZP II auf die Einstellung MZP III hat und ob es da Interaktionseffekte gibt, aber das vielleicht besser dann ein bisschen später :wink:


zu hülf .... was soll ich denn jetzt am besten Vorgehen?


Herzliche Grüsse


Ofreon
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten