Hallo!
Ich bin gerade dabei für meine Dipl. arbeit einen Fragebogen auszuwerten und habe noch ein paar probleme bei der anwendung der regressionsmethoden in Spss.
Bzgl. der binären Regression: meine abhängige Varibale ist binär, also mit 0 und 1 kodiert. Meine unabhängigen Variabeln/Kovariaten haben allerdings insgesamt 5 Antwortkategorien und sind oridnal skaliert.
Kann ich so eine binäre Regression sinnvoll durchführen oder sollten die unabhängigen Variablen auch binär sein?
Gerne würde ich auch eine multiple regression durchführen, weil die abhängige Variable insgesamt 4 Branchen unterscheidet. Wenn ich bei der Durchführung allerdings die Referenzkategorie jeweils ändere erhaöte ich immer diesselben Werte für die einzelnen Parameter. Was mache ich falsch?
Danke für die Hilfe!!!
binäre regression/multiple logistische regression
-
- Beiträge: 9
- Registriert: 24.01.2012, 13:38
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Das ist etwas unverständlich.
Wenn deine AV 0/1 kodiert ist, willst du eine binäre logistische Regression rechnen. Deine UV können metrisch oder Dummy-Variablen (dichotom) sein.
Für deine Branchen erstellst du drei Dummy-Variablen.
branche1 (1: gehört zur Branche1, 0: sonst)
branche2 (1: gehört zur Branche2, 0: sonst)
branche3 (1: gehört zur Branche3, 0: sonst)
Deine vierte Branche ist deine Referenzkategorie. Die Interpretation ist also immer in Bezug zu dieser Referenzkategorie zu sehen.
Du rechnest jetzt ganz normal deine logistische Regression mit deiner AV und den ganzen Dummy-Variablen drin. Interpretationshilfen findet Google genügend. Wichtig ist eben, dass der Effektkoeffizient Exp (B) ein Chancenverhältnis angibt und keine Wahrscheinlichkeit. Letzte muss extra berechnet werden.
EDIT: Wenn deine AV 4 nominale Ausprägungen hat, dann darfst du dich mit einer multinomialen logistischen Regression anfreunden. Im Prinzip ähnlich, nur dass die Interpretation auch immer im Vergleich zur Referenzgruppe zu sehen ist. Auch hier hilft Google kompetent weiter.
Wenn deine AV 0/1 kodiert ist, willst du eine binäre logistische Regression rechnen. Deine UV können metrisch oder Dummy-Variablen (dichotom) sein.
Für deine Branchen erstellst du drei Dummy-Variablen.
branche1 (1: gehört zur Branche1, 0: sonst)
branche2 (1: gehört zur Branche2, 0: sonst)
branche3 (1: gehört zur Branche3, 0: sonst)
Deine vierte Branche ist deine Referenzkategorie. Die Interpretation ist also immer in Bezug zu dieser Referenzkategorie zu sehen.
Du rechnest jetzt ganz normal deine logistische Regression mit deiner AV und den ganzen Dummy-Variablen drin. Interpretationshilfen findet Google genügend. Wichtig ist eben, dass der Effektkoeffizient Exp (B) ein Chancenverhältnis angibt und keine Wahrscheinlichkeit. Letzte muss extra berechnet werden.
EDIT: Wenn deine AV 4 nominale Ausprägungen hat, dann darfst du dich mit einer multinomialen logistischen Regression anfreunden. Im Prinzip ähnlich, nur dass die Interpretation auch immer im Vergleich zur Referenzgruppe zu sehen ist. Auch hier hilft Google kompetent weiter.
-
- Beiträge: 9
- Registriert: 24.01.2012, 13:38
Danke schon mal.
Vestehe ich das richtig, dass ich für jede einzelne UV Dummy-Variablen bilden muss, sprich bei 5 Antwortmöglichkeiten, 4 Dummys pro Variable?!
Ich habe relativ viele UV die ich gerne überprüfen möchte, gibt es alternative Vorgehensweisen, bzw. kann ich kategorielle UV in der multiplen Regression belassen?
Und warum muss ich Dummy-Variablen für meine Branche bilden, wenn diese AV schon mit 0 und 1 codiert ist?
Vestehe ich das richtig, dass ich für jede einzelne UV Dummy-Variablen bilden muss, sprich bei 5 Antwortmöglichkeiten, 4 Dummys pro Variable?!
Ich habe relativ viele UV die ich gerne überprüfen möchte, gibt es alternative Vorgehensweisen, bzw. kann ich kategorielle UV in der multiplen Regression belassen?
Und warum muss ich Dummy-Variablen für meine Branche bilden, wenn diese AV schon mit 0 und 1 codiert ist?
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Re: binäre regression/multiple logistische regression
Was genau heißt das? Fünfstufige Likert-style Items? Unter Umständen kann man solche Items wie intervalskalierte verwenden.Meine unabhängigen Variabeln/Kovariaten haben allerdings insgesamt 5 Antwortkategorien und sind oridnal skaliert.
Ja, was denn nun? Hast Du eine dichotome abhängige Variable oder hast DuGerne würde ich auch eine multiple regression durchführen, weil die abhängige Variable insgesamt 4 Branchen unterscheidet.
eine vierstufige kategoriale abhängige Variable? Und was willst Du mit einer
multiplen Regression bei einer kategorialen AV (egal ob nun 0/1 oder 4stufig)?
-
- Beiträge: 9
- Registriert: 24.01.2012, 13:38
AV: ich habe sie, weil ich eine binäre regression durchführen wollte in "xy-Branche" (=1) und "nicht xy-Branche" (=0) eingeteilt. Würde aber gerne durch die multiple regression die Unterschiede zwischen den einzelnen Branchen (insgesamt 4) in Bezug auf die Ausprägungen der UV herausarbeiten.
Verständlich? Ich dachte gerade weil ich meine AVin 4 verschiedene Ausprägungen unterscheiden kann, ist eine multiple Regression sinnvoll...?!
Ja, meine UV haben eine 5-stufige Likert-Skala.
Verständlich? Ich dachte gerade weil ich meine AVin 4 verschiedene Ausprägungen unterscheiden kann, ist eine multiple Regression sinnvoll...?!
Ja, meine UV haben eine 5-stufige Likert-Skala.
-
- Beiträge: 9
- Registriert: 24.01.2012, 13:38
ok, gut, danke. dann habe ich das mit den begriffen ein wenig durcheinander gebracht, aber im Endeffekt möchte ich genau das tun, eine miultinominale logistische Regression.
Was hat es nun mit den Dummy-Variablen bei der binären Regression auf sich? In einigen Büchern wird davon nichts geschrieben...
Was hat es nun mit den Dummy-Variablen bei der binären Regression auf sich? In einigen Büchern wird davon nichts geschrieben...
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Also schau dann besser in die anderen Bücher, in denen was dazu geschrieben
wird. Kategoriale und ordinale Variablen als Prädiktoren in einer Regression
müssen erst in k-1 (k ist die Zahl der Ausprägungen) dummy-Variablen
umgewandelt werden. SPSS erledigt das freundlicherweise auf Anfrage (gibt's
einen Button für im Logistische Regression Fenster). Allerdings erhöht es die
erforderliche Fallzahl für eine aussagekräftige Auswertung, da eben die Zahl der
Prädiktoren steigt. Was Deine ordinalskalierten Likert-type Items betrifft, da
wäre vielleicht eine Recherche sinnvoll, unter welchen Umständen man sowas
wie intervallskaliert verwenden kann.
wird. Kategoriale und ordinale Variablen als Prädiktoren in einer Regression
müssen erst in k-1 (k ist die Zahl der Ausprägungen) dummy-Variablen
umgewandelt werden. SPSS erledigt das freundlicherweise auf Anfrage (gibt's
einen Button für im Logistische Regression Fenster). Allerdings erhöht es die
erforderliche Fallzahl für eine aussagekräftige Auswertung, da eben die Zahl der
Prädiktoren steigt. Was Deine ordinalskalierten Likert-type Items betrifft, da
wäre vielleicht eine Recherche sinnvoll, unter welchen Umständen man sowas
wie intervallskaliert verwenden kann.