Regressionsanalyse trotz korrelierter UVs

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Regressionsanalyse trotz korrelierter UVs

Beitrag von Konkordanz »

Hallo,

kurze Frage: Mein Datensatz enthält Wahlergebnisse verschiedener Gemeinden sowie die Bevölkerungsgröße und die Geschlechterzusammensetzung dieser Gemeinden. Beim Berechnen zeigt sich, dass der Frauenanteil einen Einfluss auf das Wahlergebnis hat. Da anzunehmen ist, dass Frauen häufiger in Großstädten leben und es sich bei dem Ergebnis um eine Scheinkorrelation handeln könnte, führe ich eine Regressionsanalyse durch. Hierbei zeigt sich, dass der Einfluss des Frauenanteils stabil bleibt.

Meine Frage: Ist es überhaupt zulässig, dass ich in einer Regressionsanalyse beide Variablen aufnehme (Bevölkerungsgröße und Frauenanteil)? Denn diese hängen ja relativ stark miteinander zusammen (r=0.48). Falls es nicht zulässig ist: Welche Möglichkeit habe ich als Alternative?

Danke!
dutchie
Beiträge: 2648
Registriert: 01.02.2018, 10:45

Re: Regressionsanalyse trotz korrelierter UVs

Beitrag von dutchie »

hallo konkordanz

warum ist das einen scheinkorrelation? es korreliert! es ist vielleicht nicht direkt kausal, oder doch?
ich finde das r =.48 nicht besonders hoch ist...

wenn beide unabhängig R erhöhen müssen die in die gleichung, warum nicht..
probier mal über ein ein Venn diagramm bezüglich der varianzanteile, die anteile darzustellen
die die variablen gemeinsam haben... UV1 mit UV2 und UV1 mit AV und UV2 mit AV...

warum sollen Frauen keinen einfluss haben vielleicht wählen die anders als männer...!
aber warum gibt es in Städten mehr Frauen...vielleicht studieren frauen eher....in städten sind die Unis...
Es genügt nicht einfach rum_zu_korrelieren, man muss sich schon gedanken machen über den ganzen Kausalkomplex
beteiligter Variablen...

gruß
dutchie
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Re: Regressionsanalyse trotz korrelierter UVs

Beitrag von Konkordanz »

Du findest .48 nicht besonders hoch? Allgemein oder in Bezug auf Multikollinearität? Ich orientiere mich bei der INterpretation immer an Cohen, der glaube ich ab .30 von einem mittelstarken Zusammenhang spricht.

Sicher, ich glaube schon, dass der Frauenanteil einen Einfluss auf das Wahlergebnis hat. Es ging mir bei meiner Frage ja nicht um den Inhalt, sondern vielmehr um die Methode...ob derart korrelierte Variablen sinnvoll in einer Regression aufzunehmen sind. MIttlerweile aber habe ich mich etwas belesen und die Toleranz- und VIF-Werte zur BEantwortung meiner Frage hinzugezogen...tatsächlich scheint das Ausmaß der Multikollinearität nicht prolematisch zu sein, weshalb ich das MOdell beibehalte.

Eine Frage habe ich noch an dich: Eine Voraussetzung für lineare Regressionen sind ja auch normalverteile Residuen. Um diese zu prüfen, lass ich sie mir bei der Durchführung einer linearen Regession in einer neuen Variable speichern und berechne die Residuen-Verteilung über einen Shapiro-Wilk-Test. Dieser zeigt mir aber oft an, dass die Residuen nicht normalverteilt sind. Hier und da habe ich gelesen, dass das nicht unbedingt problematisch sein muss und man darauf verzichten könne. Was meinst du? Kann ich das Ergebnis einer linearen Regression auch dann nutzen, wenn die Residuen nicht normalverteilt sind?
dutchie
Beiträge: 2648
Registriert: 01.02.2018, 10:45

Re: Regressionsanalyse trotz korrelierter UVs

Beitrag von dutchie »

hallo

also cohen ist quatsch ...
die regression ist ja gerade geschaffen worden, um mit der korreliertheit der prädictoren umzugehen
wären die prädictoren nicht korreliert, zählt man die einfach zusammen..
Konkordanz hat geschrieben:kann ich das Ergebnis einer linearen Regression auch dann nutzen, wenn die Residuen nicht normalverteilt sind?
ja ..auf jeden fall deskriptiv! NV betrifft nur die signifikanzberechnung!
Die residuen sind ja nie nichtnormalverteilt, sondern immer mehr oder weniger normal...
insofern ist das ganze nie ganz falsch! das ist nur statistik!
die frage ist nur, ob das wirklich linear ist oder anders besser zu beschreiben ist...
auf mich wirkt das immer etwas, genaus bei "...das ist nach cohen ein starker effekt.. oder bei rftl heißt das:
das ist so groß wie drei Fussballfelder..." wie Folklore oder wie ein religiöse rituale....
Ein gutes Modell ist an sowas noch nie gescheitert...

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten