Hallo,
ich habe folgendes Problem:
Ich möchte eine Regressionsanalyse durchführen. Meine abhänige Variable ist metrisch, meine unabhänigen Variablen aber ausschließlich kategorial (z.B. treibt täglich Sport, zwei mal wöchentlich, einmal monatlich, etc. [gleiches gibt es auch für Ernährung]). Nun weiß ich, dass man bei nominalen unabhänigen Variablen einfach Dummy-Variablen erstellt.
Ist das bei meiner Art von unabhänigen Variablen allerdings sinnvoll?
Ich habe 7 derartiger Prädiktorvariablen mit jeweils 5 Ausprägungen. Muss ich dann wirklich 28 Dummy-Variablen (da Dummy-1) bilden - also
z.B.:
q1=fast täglich Sport (0=ja/1=nein);
q2=mehrmals wöchentlich Sport (0=ja/1=nein)
q3= ... etc.
...
q6=isst fast täglich Fleisch (0=ja/1=nein)
q7=isst mehrmals wöchentlich Fleisch (0=ja/1=nein)
Ergibt das denn Sinn? Kann man danach wirklich etwas aus der Regression herauslesen?
Oder müsste ich die Dummy-Variablen dann einfach nach
z.B.
q1= treibt Sport (0=ja/1=nein)
q2= isst mehr als einmal wöchentlich Fleisch (0=ja/1=nein)
usw. kodieren? (Wobei sich mir hier die Frage nach der Sinnhaftigkeit der Kodierung stellen würde.)
Über hilfreiche Antworten würde ich mich freuen! Auch sinnvolle Links sind erwünscht, da ich dazu nix finden konnte.
LG
Regression mit Dummy-Variable
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Es gibt ein solches Beispiel bei Bühl Zoefel (SPSS).
In den Sozialwissenschaften wird sehr 'großzügig' diese Problematik übegangen und statt dessen auch über ordinale Daten dann die Regression gerechnet. Die Verwendung von Dummyvariablen könnte sinnvoll sein, wenn jede in Dummy zerlegte Variable dann blockweise eingegeben werden würde.
In den Sozialwissenschaften wird sehr 'großzügig' diese Problematik übegangen und statt dessen auch über ordinale Daten dann die Regression gerechnet. Die Verwendung von Dummyvariablen könnte sinnvoll sein, wenn jede in Dummy zerlegte Variable dann blockweise eingegeben werden würde.
drfg2008