Dichotome Variablen zusammenfassen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
kabsi
Beiträge: 4
Registriert: 20.12.2011, 22:04

Dichotome Variablen zusammenfassen

Beitrag von kabsi »

Hallo,
ich bin sowohl in der Arbeit mit SPSS als auch hier neu und bemüe mich, mein Problem in verständliche Worte zu fassen.

In meiner Tabelle gibt es Schüler, die bestimmte Lernmethoden anwenden.
Die Methode selbst ist nicht als Variable vorhanden; ich weiß aber die Variablen, die jweils einer Methode zugehörig sind.

Die Variablen sind numerisch und haben für die eine der Lernmethoden die Werte 1 (ja, ich verwende diese Strategie) bzw. 0 (nein, wende ich nicht an). Hier gibt es 4 Variablen, die höchste Summe kann also 4 sein.

Für die 2. Lernmethode gibt es die Werte 2 (ja) und 0 (nein). Sie ist durch 5 Variablen vertreten, die Summe muss also gerade sein und kann höchstens 10 sein.

Wie kann ich nun aus den oben beschriebenen Variablen jeweils Gruppen bilden, in denen ich unterscheiden kann, ob jemand die eine oder die andere Methode bevorzugt?

Habe ich beispielsweise bei Methode 1 2x "1", und bei Methode 2 1x "2", so weiß ich ja nicht mehr, ob mein Ergebnis "2" jetzt der 1. oder der 2. Gruppe zuzuordnen ist.

Ich brauche für die Berechnung einer punktbiseriellen Korrelation eine Variable, in der ich eindeutig zuordnen kann, ob jemand eher Methode 1 oder 2 anwendet.

Es gibt übrigens alle Konstellationen - von "ich wende keine der Methoden an" - also Summe "0" bis "ich wende alle Methoden an" - also Summe "14"

Ich hoffe, es kann mir jemand folgen und hat einen Lösungsvorschlag.

Vielen Dank und liebe Grüße
kabsi
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

Verständnisfrage:

Gibt es ingsgesamt nur 2 verschiedene Methoden? Und dann wird der Einsatz der Methode durch 4 bzw. 5. Items gemessen? Und sind alle zu einer Methode zugehörigen positiv, sofern die Methode verwendet wurde? Anders formuliert: Wenn Methode 1 zum Einsatz kommt, weisen dann alle deine 4 Variablen den Wert 1 auf?
kabsi
Beiträge: 4
Registriert: 20.12.2011, 22:04

Beitrag von kabsi »

Hallo Skuz
Es gibt 2 Methoden, die für mich relevant sind.
Genau, der Einsatz wird durch 4 bzw. 5 Items gemessen.

Wenn bei Methode 1 nur eine der Variablen den Wert 1 aufweist, heißt das nicht, dass auch die anderen 3 den Wert 1 haben. Es kann - und ist auch häufig der Fall - auch sein, dass bei Methode 2 alle Variablen den Wert 2 aufweisen.

Die Hypothese, die ich aufgestellt habe, lautet: Schüler, die Methode 1 verwenden, haben bessere Mathematikleistungen als die, die mit Methode 2 arbeiten. Ich muss also jeweils differenzieren können, woher die Werte die Werte kommen - von Methode 1 oder Methode 2.

Vielen Dank und liebe Grüße
kabsi
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

Ok, dann wäre es zum Beispiel möglich, dass du für Methode 1 und 2 jeweils eine neue Variable erstellst, die die Ausprägung 1 annimmt, wenn Methode 1 verwendet wird und 0 wenn nicht (Recode-Befehl). Selbiges für Methode 2. Danach rechnest dann deine Korrelationen für jede Variable extra.
Dann stellt sich natürlich die Frage, ob es für dich wichtig ist, ob verschiedene "Teilbereiche" der Methode angewandt werden. Macht es einen Unterschied, ob man für Methode 1 nur auf einer Variablen die Ausprägung 1 hat oder ob man 2, 3, 4mal "ja , ich verwende diese Strategie" gesagt hat.

Was mir gerade nicht ganz klar ist: Wieso willst du eine punktbiseriale Korrelationrechnen, wenn du keine intervallskalierte Variable hast (ich geh mal davon aus, dass die Matheleistung anhand von Schulnoten, maximal Punkten gemessen werden)?
kabsi
Beiträge: 4
Registriert: 20.12.2011, 22:04

Beitrag von kabsi »

Hallo Skuz
es ist wichtig zu wissen, wie oft jemand "ja" gesagt hat.
Ursprünglich, also im Original, waren die Dateien so, dass es Abstufungen von "stimmt ganz genau" über "stimmt eher" bis zu "stimmt eher nicht" und "stimmt überhaupt nicht".
Ich habe sie transformiert und bei der ersten Methode die ersten beiden Ausprägungen zu "1" zusammengefasst, die letzten zu "0".
Bei Methode sind die "stimmt"-Werte zu "2" zusammengefasst, die anderen wieder zu 0.

Die Mathematikleistung ist metrisch skaliert.

Danke und viele Grüße
kabsi
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

Dann nochmal die Frage: Weshalb punktbiseriale Korrelation?

Deine erste Variable (Matheleistung) ist metrisch skaliert.

Für deine anderen Variablen ist es wichtig zu wissen, wie viele Teile der Methode angewendet wurden => Für Methode 1 hat die Variable 4 oder 5 Ausprägungen, abhängig davon, ob man die null mit reinnimmt. Für Methode 2 hat Variable 2 5 oder 6 Ausprägungen.
Für SPSS bedeutet das, dass du jeweils einen Index für Methode 1 und Methode 2 bildest, der die "Ja" Ausprägungen aufaddiert (compute index=var1+var2+var3+var4+var5. execute.) Dasselbe machst du für Methode 2. Danach lässt du das geeignete Korrelationsmaß ausgeben.
Summenscores anstelle von Indizien sollten hier auch möglich sein.

Diese beiden neue Variablen sind dann ordinal skaliert (manche betrachten 5 Ausprägungen auch schon als metrisch) und dann kannst die geeigneten Korrelationsmaße verwenden.

Welches du dann genau nimmst, hängt davon ab, als was du diese Variablen dann betrachtest:
http://de.wikipedia.org/wiki/Korrelatio ... _Variablen

Ob deine Hypothese "Schüler, die Methode 1 verwenden, haben bessere Mathematikleistungen als die, die mit Methode 2 arbeiten." damit ausreichend zu beantworten ist, wage ich zu bezweifeln. Die Korrelationen liefern dir nur einen ersten Anhaltspunkt dafür. Eigentlich müsstest da noch weitere Analysen nachschieben, um zu zeigen, dass Schüler, die "mehr Methode 1 verwenden" bessere Leistungen erzielen.
kabsi
Beiträge: 4
Registriert: 20.12.2011, 22:04

Beitrag von kabsi »

Stimmt, Du hast recht.
Ich bin jetzt immer noch von den ursprünglichen Variablen ausgegangen, da waren die Methoden nominal skaliert (stimme zu, stimme eher zu,....)
Ich habe sie dann in oben beschriebener Form transformiert, daher brauche ich die punktbiserielle Korrelation ja nicht.

Nach Recherche auf der von Dir verlinkten Seite müsste Pearsons Korrelationskoeffizient die richtige Wahl sein, oder?

Sorry für meine Unsicherheit, ich arbeite damit zum ersten Mal und bin Dir sehr, sehr dankbar dafür, dass Du Dich so bemühst und mir alles so geduldig erklärst.

Liebe Grüße
kabsi
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

kabsi hat geschrieben:Stimmt, Du hast recht.
Ich bin jetzt immer noch von den ursprünglichen Variablen ausgegangen, da waren die Methoden nominal skaliert (stimme zu, stimme eher zu,....)
Das war ordinal. Du kannst stimme zu, stimme eher zu...etc. klar in eine Reihenfolge bringen.
http://de.wikipedia.org/wiki/Skalenniveau#Ordinalskala

Pearsons r ist ok, wenn du 5 Ausprägungen als metrisch betrachtest. Sofern das in deinem Teilgebiet üblich ist, seh ich da keine Probleme. Jeder richtige Statistiker schlägt allerdings beide Hände übern Kopf zusammen.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten