Hallo
Ich stehe vor folgendem Problem:
In einer existierenden Tabelle gibt es eine Spalte "Sonstiges", in der Antworten erfaßt wurden, die in keine der vorherigen (vorgegebenen) Kategorien passten. Jetzt ist es aber trotzdem notwendig, diese Angaben zu untersuchen - also zu zählen. Ich will untersuchen, ob es nicht in der Fülle der Daten doch noch Symptome gibt, die gehäuft auftraten.
Ein normales Zählen bringt aber keinen Erfolg. Da die Angaben frei formuliert wurden, tritt ein und dieselbe Sache (etwa Gewichtsverlust) unter verschiedenen Namen auf - etwa "Gewichtsverlust", "Gewichtsabnahme", "Gewichtabnahme über 10 kg" usw. Dieses Problem würde ich evtl. noch mit der Funktion Umkodieren in den Griff bekommen. Weiterhin kommt es aber auch vor, daß dort (durch Komma getrennt) mehrere Angaben gemacht wurden, also "Gewichtabnahme, Appetitlosigkeit". Spätestens an dieser Stelle komme ich nicht mehr weiter, da ja dann beim "erfolgreichen" Umkodieren die Angaben hinter (oder auch vor dem Komma) wegfallen würden.
Gibt es dafür irgendeine, möglichst einfache Lösung?
Katzmárek
frei eingegebene Strings zählen oder zusammenfassen
-
- Beiträge: 4
- Registriert: 17.11.2010, 16:28
-
- Beiträge: 4
- Registriert: 17.11.2010, 16:28
Hallo
Also das wäre zum einen sehr viel Arbeit. Die Tabelle enthält fast 3000 Einträge und beim Auflisten der Häufigkeiten der Angaben unter "Sonstiges" kommt man auf über 270 verschiedene Antworten.
Also ich denke und hoffe, daß es da noch einen weiteren Weg geben muß?!...
Zum anderen habe ich aber dann dieses Problem: Wenn ich mit Umkodieren in verschiedene Spalten arbeite, dann ist es ja genau so, daß ich mir vorher überlegen muß, welche Spalten ich da brauche - und das ist ja eigentlich genau das, was ich erst rausbekommen möchte
(Zum anderen wäre es irgendwie schon schöner, wenn alles in einer Spalte bliebe...)
Also das wäre zum einen sehr viel Arbeit. Die Tabelle enthält fast 3000 Einträge und beim Auflisten der Häufigkeiten der Angaben unter "Sonstiges" kommt man auf über 270 verschiedene Antworten.
Also ich denke und hoffe, daß es da noch einen weiteren Weg geben muß?!...
Zum anderen habe ich aber dann dieses Problem: Wenn ich mit Umkodieren in verschiedene Spalten arbeite, dann ist es ja genau so, daß ich mir vorher überlegen muß, welche Spalten ich da brauche - und das ist ja eigentlich genau das, was ich erst rausbekommen möchte

(Zum anderen wäre es irgendwie schon schöner, wenn alles in einer Spalte bliebe...)
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
das ist eine qualitative analyse und dabei ist der spss-user noch stärker gefragt als bei quanitativer analyse, seine "anfrage" an spss zu formulieren. entweder müssen vorher alle antworten gesichtet werden und die häufigsten/interessantesten antworten als suchkriterien festgelegt werden. oder man überlegt sich aus der theorie heraus antworten, die interessant wären und sucht nur nach denen bzw. synonymen. letzteres ist aber nicht zuverlässig, da z.b. nicht auf rechtschreibfehler reagiert werden kann. allerdings kann man die anzahl zu sichtenden fälle reduzieren, wenn man sich am ende nur die anschaut, die bisher keinen wert bei der umcodierung erhalten haben.
die hoffung, mit einer einzigen spalte auszukommen, ist unrealistisch bei mehreren antwortmöglichkeiten. man kann mit den daten mehr anfangen, wenn die symptome getrennt sind.
die hoffung, mit einer einzigen spalte auszukommen, ist unrealistisch bei mehreren antwortmöglichkeiten. man kann mit den daten mehr anfangen, wenn die symptome getrennt sind.
-
- Beiträge: 4
- Registriert: 17.11.2010, 16:28
Also es gibt ja schon etliche Spalten für Symptome - 12 oder so...
Die, die die Fragebögen bzw. die Tabelle gemacht haben, die haben den von Dir beschriebenen Teil der Arbeit wahrscheinlich ganz gut gemacht.
Mir geht es jetzt darum, aus den Antworten, die bisher für nicht Klassifizierungswürdig gehalten wurden, weil sie etwa pro Klinik nun wirklich äußerst selten auftreten (welche aber trotzdem mal auf Verdacht mit erfaßt wurden), vielleicht doch relevante Symptome herauszusuchen. (Warum dabei allerdings Gewichtsverlust nicht erfaßt wurde, das verstehe ich nicht - da könnte man eher schon untersuchen, wie viele Formulierungen und Schreibweisen es dafür gibt
)
Ganz allgemein fällt es mir schwer, mir vorzustellen, daß ein Statistikprogramm dafür keine Lösung anbieten soll!
Man kann doch etwa bei einer Befragung, "Welche Wünsche haben Sie? (zu was auch immer) nicht vorher festlegen, was sie da Antworten werden?!...
Die, die die Fragebögen bzw. die Tabelle gemacht haben, die haben den von Dir beschriebenen Teil der Arbeit wahrscheinlich ganz gut gemacht.
Mir geht es jetzt darum, aus den Antworten, die bisher für nicht Klassifizierungswürdig gehalten wurden, weil sie etwa pro Klinik nun wirklich äußerst selten auftreten (welche aber trotzdem mal auf Verdacht mit erfaßt wurden), vielleicht doch relevante Symptome herauszusuchen. (Warum dabei allerdings Gewichtsverlust nicht erfaßt wurde, das verstehe ich nicht - da könnte man eher schon untersuchen, wie viele Formulierungen und Schreibweisen es dafür gibt

Ganz allgemein fällt es mir schwer, mir vorzustellen, daß ein Statistikprogramm dafür keine Lösung anbieten soll!
Man kann doch etwa bei einer Befragung, "Welche Wünsche haben Sie? (zu was auch immer) nicht vorher festlegen, was sie da Antworten werden?!...
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
das
möglicherweise reden wir aneinander vorbei.
ist der grund, wiesoMan kann doch etwa bei einer Befragung, "Welche Wünsche haben Sie? (zu was auch immer) nicht vorher festlegen, was sie da Antworten werden?!
für etwas unvorhersehbares kann man keine routine schreiben.daß ein Statistikprogramm dafür keine Lösung anbieten soll!
möglicherweise reden wir aneinander vorbei.
-
- Beiträge: 4
- Registriert: 17.11.2010, 16:28
Entschuldigung, aber das verstehe ich nicht - ich mache doch Dir keinen Vorwurf, daß das nicht geht?!...
Also wenn das so rüber kahm: Entschuldigung!
Ich glaube zwar nicht, daß wir aneinander vorbei reden, aber ich erkläre trotzdem nochmal was ich meine:
Ich Befrage also Dorfbewohner, was ihrer Meinung nach passierern müßte, daß das Landleben für die Menschen wieder attraktiv würde. Dann kann ich natürlich sehr viele Antworten vorgeben (finanzieller Zuschuß, mehr ÖPNV, Tante-Emma-Läden, ...). Aber vorgeben kann ich das noch nur (sinnvoll), wenn ich es vorher schon mal irgendwie (statistisch) ausgewertet habe, weil ich weiß, daß sich das viele Wünschen (egal ob nun mit SPSS oder durch Nachdenken).
Wenn ich aber nun wissen will, ob sie sich vielleicht noch was anderes Wünschen - vielleicht grad etwas, wo noch nie jemand dran gedacht hat (und ich kann dafür - das ist der Punkt - auch grad kein Bsp. liefern) - dann lasse ich sie doch aufschreiben was sie sich sonst noch wünschen und werte das dann aus.
Und gerade darum geht es, in einer frei formulierten Angabe herauszufinden, ob und was evtl. häufig auftrat!
Daß das nicht völlig automatisch geht, das also z.B. SPSS nicht von sich aus weiß, was es da zusammenfassen soll, das ist schon klar...
Mir ist schon bewußt, das ich da selber schauen muß, welche Sachen (also Schreibvarianten usw.) ich da zusammenfassen muß und daß das einige Arbeit macht - nur will ich es eben so weit wie möglich automatisieren. Dazu wäre es zumindest notwendig, daß Angaben, die ich durch Umkodieren in eine neue Variable ausgelagert habe, dann aus der alten verschwinden - damit ich zum einen sehe wie ich vorankomme und was noch getan werden muß, aber auch, damit ich dann später das verbleibende "Sonstige" automatisch zählen lassen kann.
Nebenbei: Natürlich ist es möglich, für die Auswertung von Unvorhersehbarem Routinen zu schreiben - z.B. die Quersumme aller Lottozahlen des letzten Jahres...
Also wenn das so rüber kahm: Entschuldigung!
Ich glaube zwar nicht, daß wir aneinander vorbei reden, aber ich erkläre trotzdem nochmal was ich meine:
Ich Befrage also Dorfbewohner, was ihrer Meinung nach passierern müßte, daß das Landleben für die Menschen wieder attraktiv würde. Dann kann ich natürlich sehr viele Antworten vorgeben (finanzieller Zuschuß, mehr ÖPNV, Tante-Emma-Läden, ...). Aber vorgeben kann ich das noch nur (sinnvoll), wenn ich es vorher schon mal irgendwie (statistisch) ausgewertet habe, weil ich weiß, daß sich das viele Wünschen (egal ob nun mit SPSS oder durch Nachdenken).
Wenn ich aber nun wissen will, ob sie sich vielleicht noch was anderes Wünschen - vielleicht grad etwas, wo noch nie jemand dran gedacht hat (und ich kann dafür - das ist der Punkt - auch grad kein Bsp. liefern) - dann lasse ich sie doch aufschreiben was sie sich sonst noch wünschen und werte das dann aus.
Und gerade darum geht es, in einer frei formulierten Angabe herauszufinden, ob und was evtl. häufig auftrat!
Daß das nicht völlig automatisch geht, das also z.B. SPSS nicht von sich aus weiß, was es da zusammenfassen soll, das ist schon klar...
Mir ist schon bewußt, das ich da selber schauen muß, welche Sachen (also Schreibvarianten usw.) ich da zusammenfassen muß und daß das einige Arbeit macht - nur will ich es eben so weit wie möglich automatisieren. Dazu wäre es zumindest notwendig, daß Angaben, die ich durch Umkodieren in eine neue Variable ausgelagert habe, dann aus der alten verschwinden - damit ich zum einen sehe wie ich vorankomme und was noch getan werden muß, aber auch, damit ich dann später das verbleibende "Sonstige" automatisch zählen lassen kann.
Nebenbei: Natürlich ist es möglich, für die Auswertung von Unvorhersehbarem Routinen zu schreiben - z.B. die Quersumme aller Lottozahlen des letzten Jahres...
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
hatte ich auch nicht behauptet.Entschuldigung, aber das verstehe ich nicht - ich mache doch Dir keinen Vorwurf, daß das nicht geht?!...
http://pascal.kgw.tu-berlin.de/gnom/Leh ... ionen.html
ich bilde mir ein, ich hätte auch schon teile aus string-variablen herausgeschnitten, finde aber momentan dazu keine geeignete funktion. um den teil quasi zu löschen müßte man den rest in eine neue variable schreiben, die dann ausgangspunkt für weitere schritte wäre. man kann den teil vor den schnitt in eine variable schreiben, den teil nach dem schnitt in eine zweite, und beides mit CONCAT verbinden.daß Angaben, die ich durch Umkodieren in eine neue Variable ausgelagert habe, dann aus der alten verschwinden
dort sind die antworten auf 6 aus 49 begrenzt, so dass ich das eher als große variation als unvorhersehbar bezeichnen würde. während bei deinem problem die möglichkeiten fast unendlich sind und damit unvorhersehbar.Nebenbei: Natürlich ist es möglich, für die Auswertung von Unvorhersehbarem Routinen zu schreiben - z.B. die Quersumme aller Lottozahlen des letzten Jahres...