Interpretationshilfe
-
- Beiträge: 32
- Registriert: 02.05.2011, 18:26
Interpretationshilfe
Ich habe eine Frage zur Interpretation von Interaktionseffekten innerhalb einer Regression.
Gebildet wurden Produktvariablen aus einer Dummy-Variable (mit Wert 0 für das eine Land und Wert 1 für das andere Land) und verschiedenen anderen Variablen (Geschlecht, Alter). Diese Produkltvariablen wurden in die Regression als abhängige Variablen eingeführt. Die abhängige Variable ist das Einkommen.
Was würde ich diesem Fall ein Wert von 0,005 beispielsweise bei der Produktvariable (Alter*Dummy-Land) bedeuten?
Ich hoffe, dass ich mich verständlich ausdrücken konnte und mir einer von euch vielleicht weiterhelfen kann.
Gebildet wurden Produktvariablen aus einer Dummy-Variable (mit Wert 0 für das eine Land und Wert 1 für das andere Land) und verschiedenen anderen Variablen (Geschlecht, Alter). Diese Produkltvariablen wurden in die Regression als abhängige Variablen eingeführt. Die abhängige Variable ist das Einkommen.
Was würde ich diesem Fall ein Wert von 0,005 beispielsweise bei der Produktvariable (Alter*Dummy-Land) bedeuten?
Ich hoffe, dass ich mich verständlich ausdrücken konnte und mir einer von euch vielleicht weiterhelfen kann.
-
- Beiträge: 32
- Registriert: 02.05.2011, 18:26
vielleicht könnte mir auch fiktives Beispiel helfen. Wichtig ist nur, dass die Interaktion (Dummyvariable mit zwei Ländern * beliebige Variable) und der Effekt auf eine aV deutlich gemacht wird. Was bedeutet (in einem beliebigen Beispiel) der Koeffizient einer bestimmten Produktvariable für die aV, wenn die Produktvariable "indirekt" für zwei Länder steht. Welche Aussagen können dann für Land a (Wert 0 in der Dummy-V.) und Land b (Wert 1 in der Dummy-V.) gemacht werden?
Würde mich sehr über eine Antwort freuen, denn ich weiß einfach nicht, wie ich das Interpretieren/Formulieren kann.
DANKE!
Würde mich sehr über eine Antwort freuen, denn ich weiß einfach nicht, wie ich das Interpretieren/Formulieren kann.
DANKE!
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
-
- Beiträge: 32
- Registriert: 02.05.2011, 18:26
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Wenn man mal annimmt, dass b1 als beta für den Effekt Land1 relativ zu Land0 positiv ist, dann heißt das, wenn jemand in Land 1 lebt statt Land 0, dann ist die AV im Schnitt (!) um den Betrag b1 höher.
Ist das Alter=0 (was in der Realität bedeutungslos ist, aber häufig wird eine Moderatorvariable zentriert, so dass ihr Mittelwert 0 ist, was an allem anderen nichts ändert, aber die Interpretation häufig erleichtert), wird natürlich auch die Wechselwirkung Land*Alter zu 0.
Mit steigendem Alter allerdings wird der Effekt von "Land 1 relativ zu Land 0" noch weiter gesteigert (positives Wechselwirkungs-beta) bzw. abgeschwächt (negatives Wechselwirkungs-beta). Die Schere zwischen den Ländern in Bezug auf die AV wird also mit steigendem Alter noch vergrößert (positives beta) bzw. verkleinert (negatives beta).
Ist das Alter=0 (was in der Realität bedeutungslos ist, aber häufig wird eine Moderatorvariable zentriert, so dass ihr Mittelwert 0 ist, was an allem anderen nichts ändert, aber die Interpretation häufig erleichtert), wird natürlich auch die Wechselwirkung Land*Alter zu 0.
Mit steigendem Alter allerdings wird der Effekt von "Land 1 relativ zu Land 0" noch weiter gesteigert (positives Wechselwirkungs-beta) bzw. abgeschwächt (negatives Wechselwirkungs-beta). Die Schere zwischen den Ländern in Bezug auf die AV wird also mit steigendem Alter noch vergrößert (positives beta) bzw. verkleinert (negatives beta).
-
- Beiträge: 32
- Registriert: 02.05.2011, 18:26
Vielen Dank für die Antwort.
DANKE![/quote]
Das bedeutet also, dass bei einem Anstieg des Alters etc. Land 1 und Land 2 sich immer weiter voneinander entfernen, wenn der Beta-Koeffizient positiv ist und wenn er negativ ist, dann näher sich die beiden Länder immer weiter an?Mit steigendem Alter allerdings wird der Effekt von "Land 1 relativ zu Land 0" noch weiter gesteigert (positives Wechselwirkungs-beta) bzw. abgeschwächt (negatives Wechselwirkungs-beta). Die Schere zwischen den Ländern in Bezug auf die AV wird also mit steigendem Alter noch vergrößert (positives beta) bzw. verkleinert (negatives beta).
DANKE![/quote]
-
- Beiträge: 32
- Registriert: 02.05.2011, 18:26
Eigentlich ist mein Problem nun doch komplexer als ich dachte:
Gebildet wurden ja- wie bereits erwähnt Produktvariablen aus einer Dummy-Variable "Land" (mit Wert 0 für das eine Land und Wert 1 für das andere Land) und verschiedenen anderen Variablen. Unter den "anderen Variablen" befindet sich unter anderem auch die Dummy-Variable "Geschlecht", wobei Frauen den Wert 1 und Männer den Wert 0 haben.
Wie kann ich nun hier den b-Koeffizienten interpretieren?
Hoffe sehr, dass mir hier jemand weiterhelfen kann!
Gebildet wurden ja- wie bereits erwähnt Produktvariablen aus einer Dummy-Variable "Land" (mit Wert 0 für das eine Land und Wert 1 für das andere Land) und verschiedenen anderen Variablen. Unter den "anderen Variablen" befindet sich unter anderem auch die Dummy-Variable "Geschlecht", wobei Frauen den Wert 1 und Männer den Wert 0 haben.
Wie kann ich nun hier den b-Koeffizienten interpretieren?
Hoffe sehr, dass mir hier jemand weiterhelfen kann!
-
- Beiträge: 27
- Registriert: 21.05.2011, 14:54
Re: Interpretationshilfe
Hallo Nininanana,
mir fällt gerade noch etwas anderes auf. Wenn Du die Dummyvariable »Land« nicht direkt in die Regression einbeziehst, sondern auf die beschriebene Weise Produktvariablen bildest, dann bekommen beispielsweise bei der Produktvariablen »Alter * Land« alle Vp aus dem mit 0 kodierten Land in der Produktvariable den Wert 0 zugewiesen, während die Vp aus dem mit 1 kodierten Land ihr Alter zugewiesen bekommen. Du hättest auf diese Weise quasi eine Filterung vorgenommen, bei der nur die Vp aus Land 1 mit ihrem Alter in die Produktvariable eingehen und alle Vp aus Land 0 quasi herausfallen, weil sie den Wert 0 zugewiesen bekommen. Bei allen anderen Produktvariablen ist ist das dann genauso. Wenn Du dann mit den Produktvariablen statt mit den Originalvariablen eine (je nach Anzahl der einfließenden Variablen bivariate oder multiple) lineare Regression durchführst, fallen dabei alle Vp aus dem mit 0 kodierten Land quasi heraus bzw. gehen nur mit dem Wert 0 in allen Produktvariablen in die Bestimmung der linearen Gleichung (also von b im Falle einer bivariaten und von b1, b2, b3 usw. im Falle einer multiplen linearen Regression) ein. Ist es das was Du willst?
Ich denke, wenn Du solche Produktvariablen bildest, mit denen Du dann eine lineare Regression durchführen willst, wäre eine Kodierung mit –1 für das eine und +1 für das andere Land sinnvoller. Auch bei dieser Kodierung ist die Dummyvariable metrisch interpretierbar. [1] Dann würden beispielsweise bei der Produktvariablen »Alter * Land« alle Vp mit ihrem Alter und dem Vorzeichen als Kodierung des Herkunftslandes in die Produktvariable eingehen. Wenn beispielsweise eine Vp bei dieser Produktvariable den Wert –34 hat, dann heißt das, dass diese Vp 34 Jahre alt ist und aus dem mit –1 kodierten Land kommt (klar, oder?
). Damit ließe sich meiner Ansicht nach besser arbeiten, wenn Du eine lineare Regression mit Produktvariablen durchführen möchtest.
Viele Grüße
jake2042
[1]
Wenn Du beispielsweise bei der urprünglichen Kodierung mit 0 und 1 ein arithmetisches Mittel von 0,53 bekommst, dann heißt das, dass 53 % Deiner Vp aus dem mit 1 kodierten und entsprechend 47 % aus dem mit 0 kodierten Land kommen. Die einfache Prozentsatzdifferenz beträgt in diesem Falle 6 Prozentpunkte (53 minus 47). Bei einer Kodierung mit –1 und +1 statt 0 und 1 (in dieser Reihenfolge) würde das arithmetische Mittel in diesem Fall entsprechend 0,06 betragen, was bedeutet dass 6 Prozentpunkte mehr Vp aus dem mit +1 als aus dem mit –1 kodierten Land kommen.
mir fällt gerade noch etwas anderes auf. Wenn Du die Dummyvariable »Land« nicht direkt in die Regression einbeziehst, sondern auf die beschriebene Weise Produktvariablen bildest, dann bekommen beispielsweise bei der Produktvariablen »Alter * Land« alle Vp aus dem mit 0 kodierten Land in der Produktvariable den Wert 0 zugewiesen, während die Vp aus dem mit 1 kodierten Land ihr Alter zugewiesen bekommen. Du hättest auf diese Weise quasi eine Filterung vorgenommen, bei der nur die Vp aus Land 1 mit ihrem Alter in die Produktvariable eingehen und alle Vp aus Land 0 quasi herausfallen, weil sie den Wert 0 zugewiesen bekommen. Bei allen anderen Produktvariablen ist ist das dann genauso. Wenn Du dann mit den Produktvariablen statt mit den Originalvariablen eine (je nach Anzahl der einfließenden Variablen bivariate oder multiple) lineare Regression durchführst, fallen dabei alle Vp aus dem mit 0 kodierten Land quasi heraus bzw. gehen nur mit dem Wert 0 in allen Produktvariablen in die Bestimmung der linearen Gleichung (also von b im Falle einer bivariaten und von b1, b2, b3 usw. im Falle einer multiplen linearen Regression) ein. Ist es das was Du willst?
Ich denke, wenn Du solche Produktvariablen bildest, mit denen Du dann eine lineare Regression durchführen willst, wäre eine Kodierung mit –1 für das eine und +1 für das andere Land sinnvoller. Auch bei dieser Kodierung ist die Dummyvariable metrisch interpretierbar. [1] Dann würden beispielsweise bei der Produktvariablen »Alter * Land« alle Vp mit ihrem Alter und dem Vorzeichen als Kodierung des Herkunftslandes in die Produktvariable eingehen. Wenn beispielsweise eine Vp bei dieser Produktvariable den Wert –34 hat, dann heißt das, dass diese Vp 34 Jahre alt ist und aus dem mit –1 kodierten Land kommt (klar, oder?

Viele Grüße
jake2042
[1]
Wenn Du beispielsweise bei der urprünglichen Kodierung mit 0 und 1 ein arithmetisches Mittel von 0,53 bekommst, dann heißt das, dass 53 % Deiner Vp aus dem mit 1 kodierten und entsprechend 47 % aus dem mit 0 kodierten Land kommen. Die einfache Prozentsatzdifferenz beträgt in diesem Falle 6 Prozentpunkte (53 minus 47). Bei einer Kodierung mit –1 und +1 statt 0 und 1 (in dieser Reihenfolge) würde das arithmetische Mittel in diesem Fall entsprechend 0,06 betragen, was bedeutet dass 6 Prozentpunkte mehr Vp aus dem mit +1 als aus dem mit –1 kodierten Land kommen.