Altersvariable gruppieren

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
filan27
Beiträge: 5
Registriert: 18.01.2012, 12:59

Altersvariable gruppieren

Beitrag von filan27 »

Liebe SPSS-Experten :) Ich bin nicht absoluter SPSS-Neuling, aber einige "Tricks" fehlen mir dennoch...
Ich vermute, mein "Problem" ist gar keines, sondern eher ein Brett vor meinem Kopf. Wäre für Hilfe sehr dankbar.

Ich habe eine Altersvariable, die von 17 bis 97 Jahren reicht. Diese habe ich in eine neue Variable "alt_grupp" umgeschrieben:
1 = 17 - 39 Jahre
2 = 40 - 64 Jahre
3 = 65 - 97 Jahre.

Für meine log. Regressionsanalyse möchte ich nun zwei neue Variablen schreiben, die jeweils die jüngste Altersgruppe als Referenzkategorie beinhalten. Etwa so:
alt_1: 1 = 40-64 0 = 17-39
und
alt_2: 1 = 65-97 0 = 17-39.

Ich habe es beispielsweise so probiert:

compute alt_1 = alt_grupp.
IF (alt_grupp eq 2) alt_1 = 1.
IF (alt_grupp eq 1) alt_1 = 0.
FORMATS alt_1 (f8).
variable labels alt_1 "Altersgruppe 2: 40-64-Jährige".
value labels alt_1 1 "40-64" 0 "Unter-40-Jährige".

Problem dabei: Die Werte auf der "3" bei alt_grupp bleiben drin. Kann ich diese dann einfach mit missing values ausschließen für diese eine Variable?

Mir schwant, meine Herangehensweise ist völliger Blödsinn, mir will aber nichts besseres einfallen...
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Alles,was Altersgruppe 2 ist, bekommt eine 1. Alles andere bekommt eine 0. Nix missing values.

Du kannst das allerdings auch alles durch SPSS erledigen lassen, da gibt es den
Button "Kategorial", da gibst Du Deine ltersgruppenvariable ein und gibst an,
welche Gruppe die Referenzgruppe sein soll.

Was den Blödsinn angeht, der besteht bis zum Beleg des Gegenteils darin, eine
intervallskalierte Variable zu einer kategorialen zu machen.
filan27
Beiträge: 5
Registriert: 18.01.2012, 12:59

Beitrag von filan27 »

Danke schon mal.

Aber dann habe ich ja auf der "0" alle anderen stehen, genau das will ich nicht, sondern jeweils nur die jüngste Altersgruppe als Referenz.

Ich will quasi die Ältesten und die Mittleren jeweils mit den Jüngsten vergleichen. Grob ausgedrückt.
Also:
var1: 1=Älteste 0=Jüngste
var2 1=Mittlere 0=Jüngste

Entweder ich steh auf dem Schlauch oder ich bringe nicht recht rüber, was ich anstrebe.

Und was den Blödsinn angeht, den Du meinst: ist immer eine inhaltliche Frage, oder?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Für eine 3-stufige kategoriale Variable erstellst Du 2 neue dummy-Variablen,
die Referenzgruppe bekommt keine eigene Variable. Glaub's einfach.
Und was den Blödsinn angeht, den Du meinst: ist immer eine inhaltliche Frage, oder?
Nein, keineswegs. Kategorisierung verschenkt immens statistische Informationen
und führt mitunter zu statistischen Artefakten. Man kann sich solche Späßchen
in der deskriptivstatistischen Darstellung gönnen, in der Inferenzstatistik ist das
so gut wie immer unnötig und potenziell schädlich, also fehl am Platz. Wo und
wie die Kategoriengrenzen festgelegt werden, ist dan noch ein weiterer Quell
potenziellen "Blödsinns" (der Begriff kommt ja von Dir, daher verwende ich ihn
mal weiter). Daher der Hinweis, dass da schon eine gescheite Begründung
bestehen sollte.
filan27
Beiträge: 5
Registriert: 18.01.2012, 12:59

Beitrag von filan27 »

danke! ich hab es gerafft. auf herkömmliche weise hab ich es zwar nicht hinbekommen, aber dann so wie du meintest, es spss selbst machen lassen. jetzt kenne ich auch die befehle dazu.

danke! :)

(ich hab gleich noch eine frage, aber dazu mach ich mal nen neuen thread auf)
makrophage
Beiträge: 2
Registriert: 29.03.2012, 12:14

simples problem...

Beitrag von makrophage »

ich hoffe hier kann mir jemand helfen. kenne mich nicht so gut mit spss aus...

ich habe eine variable für den bodymassindex und die würde ich gerne unterteilen in
1=untergewicht
2=normalgewicht etc.

Ich habe es mal so versucht:


freq gewicht.

DATASET ACTIVATE DatenSet1.

IF (BMI eq < 18) gewicht eq 1.

IF (BMI eq > 18 and BMI eq < 25) gewicht eq 2.

IF (BMI eq > 25 and BMI eq < 30) gewicht eq 3.

IF (BMI eq > 30) gewicht eq 4.

value labels gewicht
1 'untergewicht'
2 'normalgewicht'
3 'übergewicht'
4 'adipositas'.
EXECUTE.

freq gewicht.

Da sagt spss: 217 IF Die Operatorfolge ist ungültig. Prüfen Sie den Ausdruck auf falsche Anzahl von Operanden, Operatoren und Klammern.

Hab schon alles mögliche versucht... Hat hier vielleicht jemand nen Tip für mich???
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Die Operatorfolge wird bemängelt.
Also wohl eq <
Hab schon alles mögliche versucht...
Aha. Und das wäre zum Beispiel...?
makrophage
Beiträge: 2
Registriert: 29.03.2012, 12:14

Beitrag von makrophage »

= anstatt eq und ohne () und solche sachen...
hat sich aber schon geklärt. trotz fehlermeldung hat er das berechnet. habs jetzt erst bemerkt...
danke trotzdem für die antwort!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten