Hallo zusammen
Ich habe eine Frage, die zumindest für mich relativ schwierig zu Formulieren ist (mangelndes statistisches Vokabular!). Ich werde deshalb mal schreiben, was ich erreichen möchte, vielleicht versteht jemand mein Anliegen (bin auch nicht sicher ob es überhaupt möglich ist).
Ausgangslage:
System: SPSS (PASW 18)
Abh. Var.: Wahwahrscheinlichkeit eines Wählers i zur Wahl der Partei j
interessierende unabh. Var.: Nutzenfunktion des Wählers i In Abhängigkeit seiner Issuepositionen (vj) und der Issuepositionen der Partei (pj).
Kontrollvariablen: Alter, Geschlecht, Bildung...etc.
Problem 1:
Gemäss Theorie gibt es ein Modell in dem es 2 verschiedene Nutzenkomponente gibt, wobei ein Teil der Wähler die erste ein anderer Teil die zweite "anwendet". Beide Nutzen werden in Abhängigkeit derselben Variablen definiert:
U1=f(xi,pj)
U2=f(xi,pj)
Um das Modell zu testen und mit anderen Modellen zu vergleichen, will ich beide Komponenten in eine Regressionsgleichung einbeziehen. Nun sollten die Werte eines Falles entweder der ersten Nutzenfunktion oder der zweiten zugeschrieben werden, nicht aber beiden. Muss/kann ich das irgendwie definieren (statistisch und im SPSS)?
In der Arbeit aus der das Modell stammt wird ein multinominales Logitmodell gerechnet wobei Beta 1+Beta 2 = 1 definiert wird, um das abzubilden.
Problem 2:
Da beide Variablen von denselben Werten abhängig sind (U1 und U2 sind f (xi,pj)) habe ich Multikollinearität erwartet. Also habe ich dafür getestet indem ich eine Regressionsgleichung mit allen unabh. Variablen gerechnet habe:
xk=betao+Summe(Beta l *xl), wobei k nicht = l
R-Quadrat war dabei 0.55 was heisst die Toleranz (=1-R-Quadrat) ist > 0.2 was gemäss wikipedia NICHT auf starke Multikollinearität hinweist. Ist das korrekt so?
Ich wäre froh, könnte jemand auf dieses Anliegen reagieren, ich weiss es ist ziemlich wirr formuliert! Besten Dank
lg, Reto
Gleiche Unabh. Var. mehrmals in Regressionsgleichung
-
- Beiträge: 9
- Registriert: 19.05.2010, 10:30