Kodierung von Variablen - Bitte um Hilfe!

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Attirb86
Beiträge: 18
Registriert: 06.03.2010, 19:01

Kodierung von Variablen - Bitte um Hilfe!

Beitrag von Attirb86 »

Hallo an euch alle,

ich schreibe gerade meine Examensarbeit im Fach Deutsch, habe noch niemals etwas mit SPSS bzw. PASW ausgewertet und auch keinerlei Ahnung davon. In meiner Examensarbeit mache ich allerdings eine empirische Untersuchung, die ich irgendwie auswerten muss - zu dem Zweck habe ich mir "Statistik mit SPSS" ausgeliehen, in der Hoffnung, mich selbst in das Programm einarbeiten zu können.

Ich habe gerade überlegt, wie ich die Variablen kodiere, und bin da auf ein erstes Problem gestoßen. (Tut mir leid, wenn ich das hier etwas weitschweifig erklären muss!)

Es geht um Folgendes: Die Kinder lesen vier verschiedene Texte A1, A2, B1 und B2; jedes Kind liest insgesamt aber nur zwei Texte, nämlich die Kombination A1 und B2 oder A2 und B1. Im Folgenden bekommen die Kinder Aufgaben zum Text A bzw. Text B, die das Verständnis überprüfen. Vereinfacht dargestellt möchte ich Verschiedenes untersuchen: Haben die Kinder, die die Texte A1 und B1 gelesen haben, mehr richtige Antworten als die Kinder, die die Texte A2 und B2 gelesen haben? Haben die Kinder, die den Text A1 gelesen haben, mehr richtige Antworten als die Kinder, die Text B1 gelesen haben?

Das Problem ist nun das folgende:

Wenn ich einer Variable die Bezeichnung "Anzahl richtiger Antworten bei A1" zuweise, einer weiteren "Anzahl richtiger Antworten bei A2", der dritten "Anzahl richtiger Antworten bei B1" und der vierten "Anzahl richtiger Antworten bei B2" wäre es zum einen ja so, dass man bei jedem Kind nur die Hälfte der Variablen ausfüllen könnte, weil sie die anderen beiden Texte gar nicht gelesen haben - hier die erste Frage: Kann man eine Variable sozusagen sperren und bei der Analyse dann hinterher nur die Kinder auswählen, die den jeweiligen Text auch gelesen haben?
Die zweite Frage: Kann man die Summe zweier Variablen mit zwei weiteren Variablen vergleichen? (Also hier Anzahl der richtigen Antworten von A1 und B1 im Vergleich zu A2 und B2) Oder müsste man hier für jeden Teilnehmer schon die Summe aus A1 und B1 bzw. A2 und B2 als Variable anlegen?

Ich hoffe, das ist jetzt einigermaßen verständlich erklärt, ich hab leider, wie gesagt, keinerlei Ahnung ...

Es wäre sehr nett, wenn mir jemand, der sich damit auskennt, helfen könnte!!!

Vielen Dank im Voraus! :-)

Liebe Grüße
Britta
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

man muss eine gruppenvariable anlegen, die verschlüsselt, ob ein kind zur gruppe gehört, die a1 und b2 gelesen hat, oder ob es zur anderen gruppe gehört. wahrscheinlich braucht man mehrere gruppenvariablen, d.h. auch eine variable, die besagt, welches kind a1 oder b1 gelesen hat.

dann wird aus den antworten auf die 4 texte 1 variable errechnet --> transformieren, berechnen, falls

wie genau kommt darauf an, was man will. ich kann nicht beurteilen, ob es sinnvoll ist, a1 und a2 zusammenzuzählen, oder die summen a1+b2 und a2+b1 zu vergleichen. ggf. mit dem betreuer der arbeit absprechen, wie genau die abhängige variable (antworten) gebildet werden muss. jedenfalls muss es für den vergleich der texte a1 und b1 eine variable geben, die für einen teil der kinder die antworten von a1 enthält, und für den anderen teil b1. wahrscheinlich wird man mehrere variationen von "anzahl richtiger" bilden müssen.
Attirb86
Beiträge: 18
Registriert: 06.03.2010, 19:01

Beitrag von Attirb86 »

Hallo Karin,

danke für deine Antwort!

In dem Buch habe ich den Begriff "Gruppenvariable" nicht gefunden (ich habe das Programm selbst nicht hier, muss es nächste Woche an der Uni machen) - falls ich das nicht hinkriege, darf ich dich dann noch mal fragen, wie genau man konkret eine Gruppenvariable erstellt? (So eine Erklärung für Dumme wäre nett!)

Ich hatte sonst überlegt, ob man vielleicht, wenn die eigentlichen Werte von 0 bis 4 gehen, den Kindern, die die Texte nicht gelesen hat, den Wert 5 zuweist und dann bei dem Vergleich zweier Werte diese Option mit "falls" aktiviert, so dass die Kinder, die dort eine 5 stehen haben, die Texte ergo nicht gelesen haben, nicht mit in die Wertung einbezogen werden - ginge das vielleicht auch?

Meine betreuende Dozentin kennt sich leider mit Statistik und dem Programm überhaupt nicht aus, so dass ich mich damit ziemlich überfordert fühle und irgendwie alleine damit klarkommen muss ...

Das Problem ist, dass es insgesamt alles noch viel komplizierter ist, weil die richtigen Antworten noch in verschiedene Kategorien aufgeteilt werden müssen, so dass ich inzwischen bei 292 Variablen bin - KANN das Programm so viele Variablen annehmen?
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

das programm kann locker ein paar tausend variablen aufnehmen.

gruppenvariable/ unabhängige variable findet man bei t-test, varianzanalyse.

ich glaube, dir/ euch ist noch nicht so klar, was gerechnet werden soll. ich würde mir das mal überlegen und dann fällt es leichter zu überlegen, wie man es umsetzt. die texte, die nicht gelesen wurden, mit 5 zu markieren, denke ich, macht keinen sinn.
Attirb86
Beiträge: 18
Registriert: 06.03.2010, 19:01

Beitrag von Attirb86 »

Danke!

Stimmt, mir ist das mit den Berechnungen wahrlich nicht so klar. Mein Ziel ist es a) Mittelwerte auszurechnen (was ich ja auch so ohne ein Programm könnte), die dann b) miteinander verglichen werden - und ich möchte errechnen, ob die Ergebnisse für die gewählte Stichprobe überhaupt signifikant sind. c) soll bei bestimmten Variablen geguckt werden, ob eine Korrelation vorliegt. Ich glaube, die Berechungen selbst sind nicht mal so kompliziert, kompliziert sind nur die vielen Variablen.

Es soll 1) kontrolliert werden, ob die Kinder mit den Texten A1 und B1 besser beim Verständnis abschneiden, 2) bei welchen Typen von Kohärenzrelationen die meisten richtigen Antworten zu verzeichnen sind und welchen Text die Kinder gelesen haben, 3) ob die Kinder bei vorwärts oder rückwärts gerichteten Relationen besser abschneiden, 4) - hmm, okay, das geht hier gerade zu weit, also es lässt sich festhalten: Es sind ein paar einzelne Vergleiche, kompliziert wird das Ganze wegen der vielen verschiedenen Daten.

Schade, dass das mit der 5 keine gute Idee ist. Wäre das einfach unüblich oder nicht sinnvoll, weil eine 5 dort nichts zu suchen hat, oder einfach falsch? Denn mit der "Methode der 5" könnte ich doch bewirken, dass nur jeweils die Werte der Kinder verglichen werden, die die jeweiligen Texte aus gelesen haben, oder?

Also Beispiel: Sei N = 6. (in echt ist die Stichprobe natürlich größer!)

Kinder 1, 3 und 5 lesen Texte A1 und B2, Kinder 2, 4 und 6 Texte A2 und B1.

Mal angenommen, die Variablen 1, 2, 3 und 4 geben die Anzahl der richtigen Antworten der Aufgaben zu Text A1, A1, B1 und B2 wieder. Variable 5 markiert das Alter der Kinder (1 = 4. Klasse, 2 = 6. Klasse).

Dann stünde da etwa:

1 2 3 4 5
1 3 5 5 1 1
2 5 4 2 5 2
3 3 5 5 4 2
4 5 1 2 5 1
5 4 5 5 2 2
6 5 2 4 5 1

Mein Ziel wäre es nun, mit Hilfe von Berechnungen die Variablen 1 und 3 bzw. 2 und 4 mit der Variable 5 zu vergleichen. Ich möchte ermitteln, wie die Kinder bei den Texten A1 und B1 im Vergleich zu den Texten A2 und B2 abgeschnitten haben und wie man das in den Bezug zum Alter setzen kann. In diesem Beispiel würde man dann sehen, dass die Kinder der Altersgruppe 1 bei 1 und 3 bessere Werte erzielt haben, die Kinder der Altersgruppe 2 jedoch bei 2 und 4. Ich hatte gehofft, man könnte dann einfach die Mittelwerte von 1 und 3 berechnen, ohne die 5 einzubeziehen, und gucken, inwiefern diese mit dem Alter zusammenhängt - also gehofft, das Programm würde einem dann ausspucken, dass die Werte höher sind, wenn die Kinder in der Altersgruppe 1 bzw. im zweiten Fall 2 sind. Und ich hätte gehofft, dass das Programm mir ausrechnet, ob die Ergebnisse überhaupt signifikant sind. Geht das? Ich habe einfach keine Ahnung, was man wie genau ausrechnen kann, weil ich mich mit Statistik eben überhaupt nicht auskenne ... Man könnte das vielleicht auch über eine Korrelationsanalyse machen, weil man aufsteigende Werte von 0 bis 4 mit den beiden Altersgruppe 1 und 2 vergleicht, oder?

Ich hoffe, es ist einigermaßen verständlich ...
Es wäre sehr nett, wenn du mir noch sagen könntest, ob das mit der 5 nun wirklich so unsinnig ist!
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

die 5 ist unsinnig, weil spss eine gruppenvariable braucht, um mittelwerte (oder ggf. auch rangsummen) für verschiedene gruppen (z.b. kinder, die unterschiedlichte texte gelesen haben) zu vergleichen. aber wenn du es mit der 5 versuchen möchtest, dann probier es aus. versuch macht klug. kenntnisse von statistik und spss wirst du dir sowieso aneignen müssen, denn ein forum kann hilfe nicht in ausreichendem umfang leisten.
Attirb86
Beiträge: 18
Registriert: 06.03.2010, 19:01

Beitrag von Attirb86 »

Okay, dann sollte ich das wohl lieber lassen.

Ich hatte auch vor, mich erst nächste Woche richtig damit zu befassen, wenn ich das Programm vor mir habe - war dann eben nur beim Kodieren der Variablen schon auf Probleme gestoßen, die ich vorher gerne klären wollte. Dass das insgesamt nicht über das Internet gelöst werden kann, ist klar (leider!) Ich hoffe sehr, dass es komplizierter aussieht, als es dann in Wirklichkeit ist ...
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten