Hallo zusammen!
Ich soll im Rahmen meiner Diplomarbeit eine multiple Regression mit 6 UVs rechnen.
Mir ist auch einigermaßen klar was welche Werte in dem Output bedeuten. Wichtig sind ja anscheinend vor allem das korrigierte R-Quadrat und die Betakoeffizienten.
Nur weiß ich nicht, wie ich die Zahlen in den jeweiligen Zellen zu lesen habe.
Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?
Und nun zu den Betakoeffizienten:
Dort kommen auch teilweise negative Zahlen raus. Heißt dass dann einfach, es ist ein negativer Zusammenhang zwischen der jeweiligen UV und der AV?
Also z. B. ist Beta für das Bildungsniveau -0,12. Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?
Und allgemein zu den Betakoeffizienten:
Wie sind die zu interpretieren?
Also heißt Beta von -0,12, dass Bildung einen so und so starken Einfluss auf die AV hat?
Wie rechne ich denn die Betas in Einfluss auf die AV um?
Ich hoffe ich habe mich verständlich ausgedrückt. Würde mich sehr freuen, wenn mir jemand weiterhelfen könnte. Ich finde für dieses Problem leider nirgends eine Erklärung…
Besten Dank sagt die Tomate
Output der multiplen Regression verstehen
-
- Beiträge: 2
- Registriert: 20.04.2011, 15:55
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Ja, wobei man sich bei 0,073 wohl eher fragen sollte, ob man die richtigen Variablen im Modell hat, da die Erklärungsleistung doch eher mies ist (abhängig von der Fachrichtung und Fragestellung).Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?
Genauso ist es.Und nun zu den Betakoeffizienten:
Dort kommen auch teilweise negative Zahlen raus. Heißt dass dann einfach, es ist ein negativer Zusammenhang zwischen der jeweiligen UV und der AV?
Sofern dein Bildungsniveau aufsteigend codiert ist, würde eine um eine Einheit gestiegenes Bildungsniveau (lassen wir mal die Frage, wie sinnvoll es ist das Bildungsniveau als metrisch zu betrachten beiseite) bedeuten, das sich der Wert der AV um 0,12 Einheiten verkleinert.Also z. B. ist Beta für das Bildungsniveau -0,12. Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?
Was bedeutet für dich Einfluss? Willst du Wahrscheinlichkeiten haben?Also heißt Beta von -0,12, dass Bildung einen so und so starken Einfluss auf die AV hat?
Wie rechne ich denn die Betas in Einfluss auf die AV um?
Betas sind Effektkoeffizienten, d.h. sie geben dir an Stärke und Richtung des Effekts an. Du kannst also vergleichen welche UV die AV stärker determiniert.
Eine Übersicht, die ich spontan per Google gefunden habe zu dem Thema, findet man hier: http://www.home.uni-osnabrueck.de/rnike ... on_V02.pdf
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Nein. Das gilt nur beim R-Quadrat. Das korrigierte R-Quadrat berücksichtigt auch noch die Anzahl der Prädiktoren und wird mit dem R-Quadrat verglichen. Sollte das korrigierte R-Quadrat kleiner sein als das R-Quadrat, dann liegt wahrscheinlich ein überbestimmtes Modell vor. Also: Zur Bestimmung der erklärten Varianz an der gesamten Varianz das R-Quadrat verwenden und zuvor das überbestimmte Modell reduzieren.Mein korrigiertes R-Quadrat ist 0,073.
Was heißt dass dann wie viel Prozent der Varianz werden durch die UVs aufgeklärt? 7,3%?
Das ließe sich erst beurteilen, wenn wenn deine Codierungen bekannt wären. Jedenfalls liegt ein gegenläufiger Zusammenhang vor (unter Berücksichtigung der Codierungen). Ob dieser allerdings signifikant ist, ergibt sich aus dem t-Test.Heißt das dann mit steigenden Bildungsniveau nimmt der Wert der AV zu?
Schau mal hier nach:
http://www.youtube.com/watch?v=NC1WVMYZbnk
@Skuz:
Bist du sicher, dass du das nicht mit dem b-Koeffizienten verwechselst?Sofern dein Bildungsniveau aufsteigend codiert ist, würde eine um eine Einheit gestiegenes Bildungsniveau (lassen wir mal die Frage, wie sinnvoll es ist das Bildungsniveau als metrisch zu betrachten beiseite) bedeuten, das sich der Wert der AV um 0,12 Einheiten verkleinert.
Gibt nicht der beta-Koeffizient an, um wieviel Standardabweichungen sich die AV verändert? Prüfe das doch einmal.
Gruß
drfg2008
-
- Beiträge: 2
- Registriert: 20.04.2011, 15:55
Hallo und vielen Dank für eure Antworten!
Mit dem (korrigierten) R² weiß ich jetzt Bescheid. Allerdings meinte mein Prof ich solle das korrigierte als aufgeklärte Varianz angeben.
Es ist in der Tat sehr gering, allerdings waren es die Standard-soziodemographischen Variablen als UVs, daher ist es ja auch was Wert zu wissen, dass die die AV nicht besonders stark beeinflussen.
Bei den Soziologen nimmt man immer ganz frei auch ordinale Variablen und rechnet damit rum, als wären sie intervallskaliert…
Die Sache mit wie die Variabeln codiert sind ist mir klar.
Habe ich es richtig verstanden, dass das Beta als Zahl an sich keine Aussage hat? Sondern nur im Vergleich mit den anderen Betas im Sinne ihrer Verhältnisse interpretiert werden kann?
Also ich kann anhand des Beta von -0,12 nicht sagen dass der Einfluss der Bildung gering ist?
Den besten Dank für eure Hilfe und die Links!
Mit dem (korrigierten) R² weiß ich jetzt Bescheid. Allerdings meinte mein Prof ich solle das korrigierte als aufgeklärte Varianz angeben.
Es ist in der Tat sehr gering, allerdings waren es die Standard-soziodemographischen Variablen als UVs, daher ist es ja auch was Wert zu wissen, dass die die AV nicht besonders stark beeinflussen.
Bei den Soziologen nimmt man immer ganz frei auch ordinale Variablen und rechnet damit rum, als wären sie intervallskaliert…
Die Sache mit wie die Variabeln codiert sind ist mir klar.
Habe ich es richtig verstanden, dass das Beta als Zahl an sich keine Aussage hat? Sondern nur im Vergleich mit den anderen Betas im Sinne ihrer Verhältnisse interpretiert werden kann?
Also ich kann anhand des Beta von -0,12 nicht sagen dass der Einfluss der Bildung gering ist?
Den besten Dank für eure Hilfe und die Links!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Das korrigierte R-Quadrat wird umso kleiner je größer p im Verhältnis zu n ist [1]. Es wäre dann kein sinnvolles Maß für die Beschreibung des Anteils der erklärten Varianz an der Gesamtvarianz. Sinnvoll wäre es, beide Kennziffern anzugeben, da ein korrigiertes R-Quadrat, das kleiner ist als das R-Quadrat, auf ein überbestimmtes Modell hindeutet.Allerdings meinte mein Prof ich solle das korrigierte als aufgeklärte Varianz angeben.
Hier einmal eine kleine Simulation. Die AV des Modells ergibt sich aus den UV1 und UV2. Durch die Überbestimmung ist jedoch das korrigierte R-Quadrat niedriger als das R-Quadrat.
Code: Alles auswählen
input program.
loop a =1 to 100 by 1.
end case.
end loop.
end file.
end input program.
exe.
VECTOR uv(20).
do repeat a =uv1 to uv20.
COMPUTE a =RV.NORMAL(100,10).
end repeat.
exe.
COMPUTE AV=uv1 + uv2 + RV.NORMAL(100,10).
EXECUTE.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA CHANGE
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT AV
/METHOD=ENTER uv1 to uv20.
[1] http://de.wikipedia.org/wiki/Bestimmthe ... tsma.C3.9F
drfg2008
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Re: re
@drfg2008
Hast natürlich recht hinsichtlich der b-Koeffizienten und streng genommen auch hinsichtlich dem korrigiertem R². Es scheint sich jedoch eingeschlichen zu haben, dass ihn dennoch wie oben geschildert interpretiert. Jetzt wird mir auf einmal auch klar, weshalb meist auf Formulierungen alla "Die Modellgüte ist zufriedenstellend/gut/schlecht etc." zurückgegriffen wird.
Was die Sozialwissenschaftler (Politologen, Soziologen etc.) und deren freie Interpretation der Skalenniveaus angeht: Mein Prof. sagte dazu immer: "Statistik ist eine Hilfswissenschaft und würden wir uns so nicht behelfen, würden wir gar nichts forschen können." Man mag davon halten was man will, aber Daumenregeln alla "mindestens 5/7 Ausprägungen, dann kann man auch eine ordinale Skalierung als metrisch betrachten" sind leider weit verbreitet (und hier nehme ich mich nicht aus).
Die andere Alternative sind Dummys, was dann aber wieder neue Probleme mit sicht bringt.
Hast natürlich recht hinsichtlich der b-Koeffizienten und streng genommen auch hinsichtlich dem korrigiertem R². Es scheint sich jedoch eingeschlichen zu haben, dass ihn dennoch wie oben geschildert interpretiert. Jetzt wird mir auf einmal auch klar, weshalb meist auf Formulierungen alla "Die Modellgüte ist zufriedenstellend/gut/schlecht etc." zurückgegriffen wird.
Was die Sozialwissenschaftler (Politologen, Soziologen etc.) und deren freie Interpretation der Skalenniveaus angeht: Mein Prof. sagte dazu immer: "Statistik ist eine Hilfswissenschaft und würden wir uns so nicht behelfen, würden wir gar nichts forschen können." Man mag davon halten was man will, aber Daumenregeln alla "mindestens 5/7 Ausprägungen, dann kann man auch eine ordinale Skalierung als metrisch betrachten" sind leider weit verbreitet (und hier nehme ich mich nicht aus).
Die andere Alternative sind Dummys, was dann aber wieder neue Probleme mit sicht bringt.