Zählen für wieviele Variablen ein Fall leere Einträge hat

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
paede
Beiträge: 32
Registriert: 05.10.2010, 15:09

Zählen für wieviele Variablen ein Fall leere Einträge hat

Beitrag von paede »

Hallo Zusammen,

Ich habe einen Datensatz mit ca 90'000 Fällen, die Werte für 38 Variablen enthalten (...oder eben auch nicht). Die Variablen enthalten Textinhalte.

Was ich gerne machen würde ist eine neue Zählervariable zu erstellen, die mir für jeden Fall angibt, wieviele Variablen ohne Inhalt sind.

An einem plakativen Beispiel (mit nur 4 Variablen) sähe das so aus:

Code: Alles auswählen

Fallnr          Var1          Var2          Var3          Var4          ZählerVar
1                abc          cde                                              2
2                abc          cde           efg            hij                 0
3                abc                                                           3
Die "ZählerVar" wäre das was ich bräuchte.

Mit der COUNT-Funktion kann ich das Problem irgendwie nicht lösen, weil es sich um String-Variablen handelt.

Ich bin um jede Hilfe dankbar.
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

die funktion nmiss könnte gehen. sie zählt die anzahl der leeren zellen.
paede
Beiträge: 32
Registriert: 05.10.2010, 15:09

Beitrag von paede »

Wenn ich

Code: Alles auswählen

NMISS (Var1)
eingebe, bekomme ich ständig

Code: Alles auswählen

1 NMISS The first word in the line is not recognized as a PASW Statistics command. 

als Fehlermeldung.

Kommt das vielleicht daher, dass NMISS nicht auf String-Variablen anzuwenden ist?
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

jein. die funktion müsste man mit einem befehl wie compute verbinden. allerdings ist die funktion nmiss tatsächlich nur auf numerische variablen anzuwenden. nicht zu verstehen, warum. aber egal.

kannst du das format der variablen in string umwandeln? wahrscheinlich nicht, weil sie sicher buchstaben/wörter enthält.

gibt es eine beschränkte anzahl möglicher antworten und kannst du den antworten labels zuordnen? z.b. abc = 1, cde = 2

wenn ja, könnte man das als 1. schritt machen machen.

dann transformieren, berechnen: für jede variable eine hilfsvariable erstellen z.b. var1b als valuelabel(var1), wobei der typ der neuen variablen auf string eingestellt werden muss.

man erhält eine variable, die zahlen enthält und problemlos in numerisch umgewandelt werden kann. die numerischen variablen kann man dann beliebig zählen.

alternativ kann man die numerischen hilfsvariablen auch durch transformieren, umcodieren erstellen.
georggraph
Beiträge: 114
Registriert: 30.03.2009, 09:39

Beitrag von georggraph »

Hallo,

die folgende Syntax zählt die Häufigkeit von leeren Stringvariablen:

Code: Alles auswählen

COMPUTE ZählerVar = 0.
DO REPEAT #v = Var1 Var2 Var3 Var4 ... .
  IF LTRIM(RTRIM(#v)) = "" ZählerVar = ZählerVar + 1.
END REPEAT.
EXE.
In der Zeile "DO REPEAT #v = " trägst Du einfach Deine 38 Variablennamen ein. Vergiss nicht, hinter der 38. Variable einen Punkt zu setzen.

Viele Grüße,
georggraph
"Ein kaum merkliches Kopfnicken verriet dann, dass er nicht die Absicht habe, diese Frage zu beantworten, und es war Sache des Fragestellers, seinen eigenen Fehler zu erkennen und die Frage neu zu formulieren." (F.Kafka: Der Verschollene)
paede
Beiträge: 32
Registriert: 05.10.2010, 15:09

Beitrag von paede »

Vielen Dank!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten