Multiple & einfache lineare Regression / Regressionsanal

Beitrag von **cybersepp** » 14.12.2011, 16:09

Hallo zusammen, dank eurer Hilfe komm ich mit meiner Arbeit voran und musste nicht meinen Laptop aus dem Fenster schmeißen

Ich habe nun folgende Hypothese, welche ich nach meiner Professorin über eine Regressionsanalyse testen soll.

H: Externe Stressfaktoren (geringe Erhohlungsmöglichkeiten, Störungen im Unterricht, Lärm & geringe Ausstattung) bedingen ein erhöhtes Stressempfinden.

Ich kann die Hypothese auch noch wie folgt unterteilen:

a) Zu geringe Erhohlungsmöglichkeiten erhöhen das Stressempfinden
b) Störungen im Unterricht erhöhen das Stressempfinden
c) Lärm und Stimmbelastung erhöhen das Stressempfinden
d) Eine unzureichende Ausstattung erhöhen das Stressempfinden

Nach meiner Literatur Recherche und ein paar Videos auf Youtube bin ich nun zu folgendem Wissensstand gelangt:

[1]
Wenn ich die Hypothese nicht unterteile, dann würde ich das ganze über eine multiple Regression rechnen:

Als abhängige Variable habe ich "Stress" genommen und als Prädiktoren eben die vier (geringe Erhohlungsmöglichkeiten, Störungen im Unterricht, Lärm & geringe Ausstattung) Variablen.

Ich komme dann auf folgendes Ergebnis:
http://imageshack.us/photo/my-images/34 ... hung1.jpg/
http://imageshack.us/photo/my-images/82 ... hung2.jpg/

Entscheidend in den Tabellen ist ja zuerst das Bestimmtheitsmaß (R-Quadrat). Dieses gibt den Anteil der tatsächlichen Varian des Merkmals Stress an, der durch das Modell erklärt wird.

Mein Wert beträgt: R-Quadrat = 0.294
Nach der Literatur ist das ein eher schwacher Wert. Könnte ich das so begründen, dass neben meinen vier aufgezählten Prädiktoren sicher noch
andere Faktoren eine Rolle spielen, mit der Stress zusammenhängt? Oder hat das damit überhaupt nichts zu tun, bzw. kann ich mit einem so geringen Wert gar nicht erst weiterrechnen, oder wird dieser anders interpretiert?

Ein weiteres Problem in meinem Ergebniss ist, dass wenn ich mir die Signifikanz der einzelnen Prädiktoren anschaue, alls über 0.05 sind, dass
heißt ja dann, dass meine Werte nicht signifikant sind.

Heißt das nun, dass mein Daten für eine Regression überhaupt nicht geeignet sind, da sie weder ausreichend Varianz erklären, noch signifikant sind?
Aber mein logischer Menschenverstand sagt mir doch, dass geringe Erhohlungsmöglichkeiten, Störungen im Unterricht, Lärm & geringe
Ausstattung, eigentlich eine Auswirkung auf Stress haben müsste!?

[2]
Ich habe dann versucht einen alternativen Weg einzuschlagen, in dem ich die Hypothesen einzeln untersuche, also:

a) Zu geringe Erhohlungsmöglichkeiten erhöhen das Stressempfinden
b) Störungen im Unterricht erhöhen das Stressempfinden
c) Lärm und Stimmbelastung erhöhen das Stressempfinden
d) Eine unzureichende Ausstattung erhöhen das Stressempfinden

Dies habe ich durch (vier) einfache lineare Regressionen getestet. Ich habe mal mein Ergebnis für Punkt b) Störungen im Unterricht rauskopiert:

http://imageshack.us/photo/my-images/50 ... ngein.jpg/
http://imageshack.us/photo/my-images/24 ... ngein.jpg/

Hier habe ich zwar wieder das Problem, dass mein R-Quadrat nur 0.214 beträgt, allerdings wäre es wenigstens Signifikant (Sig. 0.000). Ist das
nun eine "bessere / sinnvollere" Auswertung?

bei a) Zu geringe Erhohlungsmöglichkeiten erhöhen das Stressempfinden komm ich auf: R-Quadrat = 0.081, sign. 0.002

c) Lärm und Stimmbelastung erhöhen das Stressempfinden: R-Quadrat = 0.221, sign. 0.000

d) Eine unzureichende Ausstattung erhöhen das Stressempfinden: R-Quadrat = 0.05, sign. 0.016

....hier hätte ich jetzt bei a) und d) schon sehr sehr geringe R-Quadrat Werte, dafür sind sie allesamt signifikant. Ist das nun von Vorteil, oder genau so "schlecht"/"satistisch unbrauchbar"?

Vielleicht kann mir jemand etwas auf den Sprung helfen, welches der Varianten "besser" ist, oder ob ich hier einen gravierenden Fehler bei der
Berechnung / Interpretation gemacht habe?
(ohje, dass ist ja ein rießen Text geworden

, ich hoffe ich habe es verständlich erklärt..)

Beitrag von **Generalist** » 15.12.2011, 10:24

Mein Wert beträgt: R-Quadrat = 0.294
Nach der Literatur ist das ein eher schwacher Wert.

Nicht nach der gängigen Literatur in den Verhaltenswissenschaften. Da ist das ein starker Zusammenhang.

Allerdings verwechselst Du andauernd Stichprobenergebnisse mit tatsächlichen Effektstärken. Tatsächliche Effektstärken gibt es nur in der Population. Die Maße, die man zur Beschreibung solcher Effektstärken in der Population verwenden kann, haben bei Verwendung in Stichproben eine andere Bedeutung. Ein R² von 0,5 in einer Stichprobe ist im eigentlichen Sinne keine Effektstärke, da in sie auch noch Stichprobenzufälle einfließen. In der Population ist R² sicherlich größer oder kleiner. Deswegen macht man schließlich auch die ganze Signifikanztesterei, weil man nämlich zumindest entscheiden will, ob der Stichproben-"Effekt" vollständig auf Zufall beruhen könnte oder nicht doch zumindest teilweise auf einem systematischen Effekt.

dass neben meinen vier aufgezählten Prädiktoren sicher noch andere Faktoren eine Rolle spielen, mit der Stress zusammenhängt?

Das versteht sich doch wohl von selbst.

Heißt das nun, dass mein Daten für eine Regression überhaupt nicht geeignet sind, da sie weder ausreichend Varianz erklären, noch signifikant sind?

Das Gesamtmodell ist inferenzstatistisch signifikant mit der AV assoziiert. Selnst wenn die einzelnen Prädiktoren nicht jeder für sich einen mit p < 0,05 "signfikanten" Zusammenhang aufweisen, ändert sich an dieser Tatsache nichts.

Ich habe dann versucht einen alternativen Weg einzuschlagen, in dem ich die Hypothesen einzeln untersuche, also:

Wenn eine geplante Auswertung nicht das erbringt, was man "beweisen" wollte, die Methode so lange zu ändern, bis das Gewünschte herusspringt, ist Manipulation und ist nicht lege artis.

Beitrag von **cybersepp** » 19.12.2011, 19:46

Lieben Dank für deine Antwort und entschuldige meine verspätete Antwort.

Allerdings verwechselst Du andauernd Stichprobenergebnisse mit tatsächlichen Effektstärken.

aber ich müsste doch dann trotzdem mein R-Quadrat = 0.294 zur interpretation heranziehen?

Das Gesamtmodell ist inferenzstatistisch signifikant mit der AV assoziiert. Selnst wenn die einzelnen Prädiktoren nicht jeder für sich einen mit p < 0,05 "signfikanten" Zusammenhang aufweisen, ändert sich an dieser Tatsache nichts.

Was meinst du mit "AV"?
Heißt, dass ich sagen kann, wenn ich über die multiple Regression rechne, dass mein Wert (R-Quadrat = 0.294), einen (recht) starken Zusammenhang widerspiegelt. Aber wie interpretiere ich dann, dass alle Werte unter p < 0.05 sind?

Wenn eine geplante Auswertung nicht das erbringt, was man "beweisen" wollte, die Methode so lange zu ändern, bis das Gewünschte herusspringt, ist Manipulation und ist nicht lege artis.

Ich habe mich leider etwas falsch ausgedrückt. Ich wollte (nicht unbedingt) mein Ergebnis so hindrehen, damit es meinen Wunschvorstellungen entspricht. Ich bin mir nur nicht sicher, bzw. mir ist es offen welchen der oben genannten Alternativen (multiple Regression oder (vier) einfache lineare Regressionen) ich verwende. Da würde ich mir nun eben die raussuchen, welche ich am besten verstehe und gut interpretieren kann.

Beitrag von **Generalist** » 19.12.2011, 21:13

aber ich müsste doch dann trotzdem mein R-Quadrat = 0.294 zur interpretation heranziehen?

Ich weiß nicht, wieso Du das "müsstest". Die Stichproben-Effektmaße (die eben keine Effektstärken sind) zu interpretieren erfordert meines Erachtens einiges methodische Know-how inclusive Kenntnis der relevanten Refernzliterartur zum selben Forschungsfeld. Andererseits ist die Verwechslung von Stichproben-Effektmaßen mit Effektstärken derart verbreitet, dass Deine Abnehmer das vielleicht sogar schlucken.

Was meinst du mit "AV"?

Abhängige Variable. Das Kriterium. Das y.

Heißt, dass ich sagen kann, wenn ich über die multiple Regression rechne, dass mein Wert (R-Quadrat = 0.294), einen (recht) starken Zusammenhang widerspiegelt. Aber wie interpretiere ich dann, dass alle Werte unter p < 0.05 sind?

Du kannst sagen, es gibt einen inferenzstatistisch signifkanten Zusammenhang zwischen Regressionsmodell und AV, lässt möglichst die Finger von Effektstärkeinterpretationen, und stellst fest, dass leider keiner der Prädiktoren für sich einen inferenzstatisch auf dem p < 0,05 Niveau signifikanten Zusammenhang mit der AV aufweist. Da gibt's eben keinen zweifelsfreien Zusammenhangsnachweis auf Einzel-Prädiktoren-Ebene. Schade, aber normalerweise nicht schlimm.

Beitrag von **cybersepp** » 20.12.2011, 20:38

Vielen Dank für die gute und detaillierte Antwort! Über die Weihnachtszeit werde ich versuchen das dazugewonnene Wissen umzusetzen!

Statistik-Tutorial Forum

Multiple & einfache lineare Regression / Regressionsanal

Multiple & einfache lineare Regression / Regressionsanal

Re: Multiple & einfache lineare Regression / Regressions