Multiple lineare Regression - kurze Verständnisfrage

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Multiple lineare Regression - kurze Verständnisfrage

Beitrag von Konkordanz »

Hallo,

ich habe nur eine kurze Verständnisfrage zur Multiplen Lin. Regressionsanalyse.

Auf der einen Seite ist es doch so, dass die UVs nicht stark miteinander korrelieren sollten, richtig? Dies wird ja über die Betrachtung der Multikollinearität berücksichtigt und infolge dessen werden die jeweiligen UVs aus dem Modell herausgenommen.

Auf der anderen Seite dient die Regressionsanalyse doch dazu, gewisse Wechselwirkungen unter den UVs zu berücksichtigen und im Ergebnis anzuzeigen, ob die eine oder andere UV in der gemeinsamen Betrachtung noch signifikant ist. Eine Bestätigung, dass die Zusammenhänge unter den UVs "herausgerechnet" werden, steht zum Beispiel wie folgt in meinem Statistikbuchu:
"Die unabhängigen (erklärenden) Variablen können dabei selbst untereinander korrelieren, was bei der Schätzung der Koeffizienten entsprechend berücksichtigt wird, um Scheinkorrelationen auszuschließen."
SPSS 16 - Bühl, Seite 366
In meinem Datensatz korrelieren beispielsweise folgende Variablen:
Hoher Frauenanteil->Hohes Wahlergebnis
Hohes Durchschnittsalter->Hoher Frauenanteil
Hohes Durchschnittsalter->Hohes Wahlergebnis

Sie korrelieren jedoch nicht so stark, als dass ich diese auf Basis der Multikollinearitätstests ausschließen müsste. Ist es also zulässig, wenn ich folgendes interpretiere?
Um den Einfluss der Merkmale auf das Wahlergebnis analysieren zu können, sollten sie nicht einzeln in die Betrachtung einfließen. Der Grund ist die Wechselwirkung unter diesen Variablen: So zeigt die Betrachtung zweier Merkmale beispielsweise, dass die Ausprägung des Wahlergebnisses für X umso höher ist, je größer der Frauenanteil einer Gemeinde ausfällt. Dies jedoch könnte zu Fehlschlüssen führen, denn es zeigt sich ebenso, dass der Frauenanteil statistisch mit dem Durchschnittsalter einer Gemeinde korreliert. Da letztlich auch das Ergebnis der Partei X tendenziell mit dem Durchschnittsalter einer Gemeinde zunimmt, ist fraglich, was statistisch nun eigentlich relevant(er) ist: Hängt das Wahlergebnis eher mit dem Frauenanteil einer Gemeinde zusammen oder ist es eher das Durchschnittsalter, welches hier einen Einfluss ausübt? Oder gar beides? Um dies zu prüfen, werden unter anderem Regressionsanalysen durchgeführt.
Danke für die Hilfe!
dutchie
Beiträge: 2648
Registriert: 01.02.2018, 10:45

Re: Multiple lineare Regression - kurze Verständnisfrage

Beitrag von dutchie »

hallo Konkordanz

vergiss einfach erstmal das geschwafel über Multikollinearität
und korreliere munter drauf los, wenn das statsitisch wichtig wird, merkst du das ....
an den Ergebnissen, wobei z.B wichtig ist, dass man die Korrelationskoeffizienten und
die Regressionskoeffizienten bei der Hand hat ... und die signifkanzen abschätzt
man merk das z.B. wenn die standardfehler der Koeffizienten "unüblich" hoch sind.
oder der Copmuter kaputt geht! :shock:
d.h du schließt keine Variablen aus..

das Problem mit der Multikollinearität ist aber auch und wesentlich ein inhaltliches, weil man nicht sagen kann
woher das Kind die Intelligenz hat, von der Mutter oder vom Vater, wenn die beiden korrelieren..
um das zu klären hat man Pfadanalysen erfunden um die Korelation der UVs untereinander zu klären.
Konkordanz hat geschrieben:Hoher Frauenanteil->Hohes Wahlergebnis
Hohes Durchschnittsalter->Hoher Frauenanteil
Hohes Durchschnittsalter->Hohes Wahlergebnis
das ist doch wichtig erkannt zu haben, aber versteht man das???
Frauen leben länger, aber warum gehen die eher zur Wahl, weil sie Frauen sind ober älter sind?
Das hat mit Statistik gar nichts zu tun!!

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten