
Ich vermute, mein "Problem" ist gar keines, sondern eher ein Brett vor meinem Kopf. Wäre für Hilfe sehr dankbar.
Ich habe eine Altersvariable, die von 17 bis 97 Jahren reicht. Diese habe ich in eine neue Variable "alt_grupp" umgeschrieben:
1 = 17 - 39 Jahre
2 = 40 - 64 Jahre
3 = 65 - 97 Jahre.
Für meine log. Regressionsanalyse möchte ich nun zwei neue Variablen schreiben, die jeweils die jüngste Altersgruppe als Referenzkategorie beinhalten. Etwa so:
alt_1: 1 = 40-64 0 = 17-39
und
alt_2: 1 = 65-97 0 = 17-39.
Ich habe es beispielsweise so probiert:
compute alt_1 = alt_grupp.
IF (alt_grupp eq 2) alt_1 = 1.
IF (alt_grupp eq 1) alt_1 = 0.
FORMATS alt_1 (f8).
variable labels alt_1 "Altersgruppe 2: 40-64-Jährige".
value labels alt_1 1 "40-64" 0 "Unter-40-Jährige".
Problem dabei: Die Werte auf der "3" bei alt_grupp bleiben drin. Kann ich diese dann einfach mit missing values ausschließen für diese eine Variable?
Mir schwant, meine Herangehensweise ist völliger Blödsinn, mir will aber nichts besseres einfallen...