Hallo.
Ich prüfe gerade meine Daten auf die Voraussetzungen einer Regressionsanalyse. Ich haben nur eine abhängige und eine unabhängige Variable, die durch eine Faktorenanalyse entstanden sind. Meine Frage: Muss ich auch auf fehlende Multikollinearität testen wenn ich nur eine einfache lineare Regression durchführe und wenn ja, wie mache ich das bei SPSS??
Muchas gracias
Multikollinearität bezeichnet meines Wissens ja die Abhängigkeit der unabhängigen Variablen untereinander, oder? Das würde dann bei nur einer Unabhängingen wenig Sinn machen es sei denn du beziehst dich hier auf die Ursprungsdaten. Gleiches gilt für das Verfahren der Regressionsanalyse.
Über die Notwendigkeit und Durchführung der Multikollinearität an sich kann ich leider wenig sagen, evtl. weiss hier jemand mehr....
Multikollinearität ist eine Modellverletzung, die nur bei multiplen Verfahren auftreten kann, d.h. wenn du mehr als eine unabhängige Variable hast. M. liegt dann vor, wenn (mindestens) 2 unabhägige Variablen zu stark miteinander korrelieren. Bei einer bivariaten Regression (wie in deinem Falle) ist dieser Test daher nicht notwendig.
Trotzdem: Identifizieren könntest du diese Fälle über die "tolerance"- und VIF-Werte. Multikollinearität liegt dann vor, wenn die tolerance-Werte nahe '0' bzw. die VIF-Werte über '3' oder '3.5' liegen. Genau definiert sind die Grenzwerte m.W. allerdings nicht.
Und wenn man schon damit anfängt, auf Modellverletzungen zu testen (was viel zu selten geschieht), sollte man auch Linearität, Normalität, Heteroskedastizität und einflussreiche Fälle ermitteln. Aber wie gesagt, in deinem Fall ist das nicht notwendig.
[quote="jule80"]Diese VIF-Werte, durch welchen Test kann ich diese erhalten? Ich möchte nämlich auch auf Kollinearität prüfen...
Danke...!!!
VG Jule[/quote]
Würde mich aber auch interessieren, wie man das testet. Aber eine grundsätzliche Frage zu Multik.: Was ist, wenn man eine multivariate Regression rechnet und für eine Drittvariable kontrollieren will, von der man genau weiß, dass sie mit der eigentlichen UV sehr hoch korreliert? D.h. man möchte den "reinen" Einfluss der UV herausfinden. Aber das wäre dann eigentlich ne Modellverletzung? Wie geht man am besten mit sowas um?