Output der multiplen Regression verstehen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Cocktailtomate
Beiträge: 2
Registriert: 20.04.2011, 15:55

Output der multiplen Regression verstehen

Beitrag von Cocktailtomate »

Hallo zusammen!

Ich soll im Rahmen meiner Diplomarbeit eine multiple Regression mit 6 UVs rechnen.
Mir ist auch einigermaßen klar was welche Werte in dem Output bedeuten. Wichtig sind ja anscheinend vor allem das korrigierte R-Quadrat und die Betakoeffizienten.
Nur weiß ich nicht, wie ich die Zahlen in den jeweiligen Zellen zu lesen habe.

Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?

Und nun zu den Betakoeffizienten:
Dort kommen auch teilweise negative Zahlen raus. Heißt dass dann einfach, es ist ein negativer Zusammenhang zwischen der jeweiligen UV und der AV?
Also z. B. ist Beta für das Bildungsniveau -0,12. Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?

Und allgemein zu den Betakoeffizienten:
Wie sind die zu interpretieren?
Also heißt Beta von -0,12, dass Bildung einen so und so starken Einfluss auf die AV hat?
Wie rechne ich denn die Betas in Einfluss auf die AV um?

Ich hoffe ich habe mich verständlich ausgedrückt. Würde mich sehr freuen, wenn mir jemand weiterhelfen könnte. Ich finde für dieses Problem leider nirgends eine Erklärung…

Besten Dank sagt die Tomate
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?
Ja, wobei man sich bei 0,073 wohl eher fragen sollte, ob man die richtigen Variablen im Modell hat, da die Erklärungsleistung doch eher mies ist (abhängig von der Fachrichtung und Fragestellung).
Und nun zu den Betakoeffizienten:
Dort kommen auch teilweise negative Zahlen raus. Heißt dass dann einfach, es ist ein negativer Zusammenhang zwischen der jeweiligen UV und der AV?
Genauso ist es.
Also z. B. ist Beta für das Bildungsniveau -0,12. Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?
Sofern dein Bildungsniveau aufsteigend codiert ist, würde eine um eine Einheit gestiegenes Bildungsniveau (lassen wir mal die Frage, wie sinnvoll es ist das Bildungsniveau als metrisch zu betrachten beiseite) bedeuten, das sich der Wert der AV um 0,12 Einheiten verkleinert.
Also heißt Beta von -0,12, dass Bildung einen so und so starken Einfluss auf die AV hat?
Wie rechne ich denn die Betas in Einfluss auf die AV um?
Was bedeutet für dich Einfluss? Willst du Wahrscheinlichkeiten haben?
Betas sind Effektkoeffizienten, d.h. sie geben dir an Stärke und Richtung des Effekts an. Du kannst also vergleichen welche UV die AV stärker determiniert.

Eine Übersicht, die ich spontan per Google gefunden habe zu dem Thema, findet man hier: http://www.home.uni-osnabrueck.de/rnike ... on_V02.pdf
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?
Nein. Das gilt nur beim R-Quadrat. Das korrigierte R-Quadrat berücksichtigt auch noch die Anzahl der Prädiktoren und wird mit dem R-Quadrat verglichen. Sollte das korrigierte R-Quadrat kleiner sein als das R-Quadrat, dann liegt wahrscheinlich ein überbestimmtes Modell vor. Also: Zur Bestimmung der erklärten Varianz an der gesamten Varianz das R-Quadrat verwenden und zuvor das überbestimmte Modell reduzieren.

Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?
Das ließe sich erst beurteilen, wenn wenn deine Codierungen bekannt wären. Jedenfalls liegt ein gegenläufiger Zusammenhang vor (unter Berücksichtigung der Codierungen). Ob dieser allerdings signifikant ist, ergibt sich aus dem t-Test.

Schau mal hier nach:

http://www.youtube.com/watch?v=NC1WVMYZbnk


@Skuz:
Sofern dein Bildungsniveau aufsteigend codiert ist, würde eine um eine Einheit gestiegenes Bildungsniveau (lassen wir mal die Frage, wie sinnvoll es ist das Bildungsniveau als metrisch zu betrachten beiseite) bedeuten, das sich der Wert der AV um 0,12 Einheiten verkleinert.
Bist du sicher, dass du das nicht mit dem b-Koeffizienten verwechselst?
Gibt nicht der beta-Koeffizient an, um wieviel Standardabweichungen sich die AV verändert? Prüfe das doch einmal.

Gruß
drfg2008
Cocktailtomate
Beiträge: 2
Registriert: 20.04.2011, 15:55

Beitrag von Cocktailtomate »

Hallo und vielen Dank für eure Antworten!

Mit dem (korrigierten) R² weiß ich jetzt Bescheid. Allerdings meinte mein Prof ich solle das korrigierte als aufgeklärte Varianz angeben.

Es ist in der Tat sehr gering, allerdings waren es die Standard-soziodemographischen Variablen als UVs, daher ist es ja auch was Wert zu wissen, dass die die AV nicht besonders stark beeinflussen.
Bei den Soziologen nimmt man immer ganz frei auch ordinale Variablen und rechnet damit rum, als wären sie intervallskaliert…

Die Sache mit wie die Variabeln codiert sind ist mir klar.

Habe ich es richtig verstanden, dass das Beta als Zahl an sich keine Aussage hat? Sondern nur im Vergleich mit den anderen Betas im Sinne ihrer Verhältnisse interpretiert werden kann?
Also ich kann anhand des Beta von -0,12 nicht sagen dass der Einfluss der Bildung gering ist?

Den besten Dank für eure Hilfe und die Links!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Allerdings meinte mein Prof ich solle das korrigierte als aufgeklärte Varianz angeben.
Das korrigierte R-Quadrat wird umso kleiner je größer p im Verhältnis zu n ist [1]. Es wäre dann kein sinnvolles Maß für die Beschreibung des Anteils der erklärten Varianz an der Gesamtvarianz. Sinnvoll wäre es, beide Kennziffern anzugeben, da ein korrigiertes R-Quadrat, das kleiner ist als das R-Quadrat, auf ein überbestimmtes Modell hindeutet.

Hier einmal eine kleine Simulation. Die AV des Modells ergibt sich aus den UV1 und UV2. Durch die Überbestimmung ist jedoch das korrigierte R-Quadrat niedriger als das R-Quadrat.

Code: Alles auswählen

input program.
loop a =1 to 100 by 1.
end case.
end loop. 
end file.
end input program.
exe.


VECTOR uv(20).
do repeat a =uv1 to uv20.
COMPUTE a =RV.NORMAL(100,10).
end repeat.
exe.

COMPUTE AV=uv1 + uv2 + RV.NORMAL(100,10).
EXECUTE.

REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA CHANGE
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT AV
  /METHOD=ENTER uv1 to uv20.





[1] http://de.wikipedia.org/wiki/Bestimmthe ... tsma.C3.9F
drfg2008
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Re: re

Beitrag von Skuz »

@drfg2008
Hast natürlich recht hinsichtlich der b-Koeffizienten und streng genommen auch hinsichtlich dem korrigiertem R². Es scheint sich jedoch eingeschlichen zu haben, dass ihn dennoch wie oben geschildert interpretiert. Jetzt wird mir auf einmal auch klar, weshalb meist auf Formulierungen alla "Die Modellgüte ist zufriedenstellend/gut/schlecht etc." zurückgegriffen wird.

Was die Sozialwissenschaftler (Politologen, Soziologen etc.) und deren freie Interpretation der Skalenniveaus angeht: Mein Prof. sagte dazu immer: "Statistik ist eine Hilfswissenschaft und würden wir uns so nicht behelfen, würden wir gar nichts forschen können." Man mag davon halten was man will, aber Daumenregeln alla "mindestens 5/7 Ausprägungen, dann kann man auch eine ordinale Skalierung als metrisch betrachten" sind leider weit verbreitet (und hier nehme ich mich nicht aus).

Die andere Alternative sind Dummys, was dann aber wieder neue Probleme mit sicht bringt.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten