[Anfängerfrage] Signifikanz zweier nominalverteilter Gruppen
-
Dems
- Beiträge: 6
- Registriert: 10.09.2012, 19:23
[Anfängerfrage] Signifikanz zweier nominalverteilter Gruppen
tl;dr: Warum unterscheidet sich das Ergebnis des exakten SPSS Fisher Tests von dem Fisher Test / Chi quadrat Tests, den man online machen kann?
Begrüßung und Experimentbeschreibung
Hallo allerseits,
ich bin ein Neuling im Gebiet Statistk / SPSS und habe ein Problem, bei dem ich mir unsicher bin, wo der Denkfehler ist.
Kommen wir zu einem Beispielexperiment:
Es werden zwei Gruppen untersucht, beide Gruppen umfassen jeweils 15 Personen.
Gruppe A hat einen Zeitungstext gelesen, der in der Schrift Times New Roman geschrieben ist.
Gruppe B hat einen Zeitungstext gelesen, der in der Schrift Comic Sans geschrieben ist.
Es wird untersucht, ob sich die Personen im anschließenden Interview zum Vorhandensein bzw. Nichtvorhandensein der Serifen äußern.
Daraus gibt sich folgende Nominalskalierung:
Variable 1 in SPSS, Gruppe A
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Variable 2 in SPSS, Gruppe B
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Dies wird mit 0 (nicht Äußerung) und 1 (Äußerung) codiert.
Datensatz
Daraus ergibt sich folgende Statistik:
A-B
1-0
1-0
1-0
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1ä
Daraus ergibt sich:
Gruppe A hat sich 3x geäußert und 12x nicht geäußert
Gruppe B hat sich 12x geäußert und 3x nicht geäußert
Unterschiede bei der Online-Auswertung und SPSS:
Gebe ich diese Ergebnisse (3-12, 12-3) auf einer der vielen Online-Plattformen ein, bekomme ich folgendes Ergebnis: p = 0.0028 (bei http://graphpad.com/quickcalcs/contingency2.cfm) oder p = 0.002814etc (bei http://vassarstats.net/tab2x2.html). Auch bei anderen Tests der Seite http://www.statpages.org/#CrossTabs komme ich auf das Ergebnis.
Bei SPSS hingegen bekomme ich mit den Rohdaten folgendes Ergebnis:
https://dl.dropbox.com/u/9584865/SPSS-Rohdaten.png
Und wenn ich die Ergebnisse eingebe:
https://dl.dropbox.com/u/9584865/SPSS-E ... ingabe.png
Problemlösung: Falsche Eingabe, n=2 laut Randwerten, danke, Generalist
=> bei beiden ist die Exakte Signifikanz (2 Seitig) nach Fisher = 1.0
Fragen
Dass das mit den Rohdaten schief geht, liegt daran, dass die Auswertung vom Chi Test nominalskaliert geschieht, oder?
Wie kommt dieser Unterschied zu Stande?
Gibt es zwischen 3 Äußerungen in Gruppe A und 12 Äußerungen in Gruppe B tatsächlich keinen signifikanten Unterschied?
Gibt es andere Methoden, mit denen ich eine Signifikanz der Ergebnisse / der Rohdaten nachweisen könnte? Oder bin ich mit Fisher / Chi Quadrat schon an der richtigen Adresse?
Begrüßung und Experimentbeschreibung
Hallo allerseits,
ich bin ein Neuling im Gebiet Statistk / SPSS und habe ein Problem, bei dem ich mir unsicher bin, wo der Denkfehler ist.
Kommen wir zu einem Beispielexperiment:
Es werden zwei Gruppen untersucht, beide Gruppen umfassen jeweils 15 Personen.
Gruppe A hat einen Zeitungstext gelesen, der in der Schrift Times New Roman geschrieben ist.
Gruppe B hat einen Zeitungstext gelesen, der in der Schrift Comic Sans geschrieben ist.
Es wird untersucht, ob sich die Personen im anschließenden Interview zum Vorhandensein bzw. Nichtvorhandensein der Serifen äußern.
Daraus gibt sich folgende Nominalskalierung:
Variable 1 in SPSS, Gruppe A
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Variable 2 in SPSS, Gruppe B
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Dies wird mit 0 (nicht Äußerung) und 1 (Äußerung) codiert.
Datensatz
Daraus ergibt sich folgende Statistik:
A-B
1-0
1-0
1-0
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1ä
Daraus ergibt sich:
Gruppe A hat sich 3x geäußert und 12x nicht geäußert
Gruppe B hat sich 12x geäußert und 3x nicht geäußert
Unterschiede bei der Online-Auswertung und SPSS:
Gebe ich diese Ergebnisse (3-12, 12-3) auf einer der vielen Online-Plattformen ein, bekomme ich folgendes Ergebnis: p = 0.0028 (bei http://graphpad.com/quickcalcs/contingency2.cfm) oder p = 0.002814etc (bei http://vassarstats.net/tab2x2.html). Auch bei anderen Tests der Seite http://www.statpages.org/#CrossTabs komme ich auf das Ergebnis.
Bei SPSS hingegen bekomme ich mit den Rohdaten folgendes Ergebnis:
https://dl.dropbox.com/u/9584865/SPSS-Rohdaten.png
Und wenn ich die Ergebnisse eingebe:
https://dl.dropbox.com/u/9584865/SPSS-E ... ingabe.png
Problemlösung: Falsche Eingabe, n=2 laut Randwerten, danke, Generalist
=> bei beiden ist die Exakte Signifikanz (2 Seitig) nach Fisher = 1.0
Fragen
Dass das mit den Rohdaten schief geht, liegt daran, dass die Auswertung vom Chi Test nominalskaliert geschieht, oder?
Wie kommt dieser Unterschied zu Stande?
Gibt es zwischen 3 Äußerungen in Gruppe A und 12 Äußerungen in Gruppe B tatsächlich keinen signifikanten Unterschied?
Gibt es andere Methoden, mit denen ich eine Signifikanz der Ergebnisse / der Rohdaten nachweisen könnte? Oder bin ich mit Fisher / Chi Quadrat schon an der richtigen Adresse?
-
Dems
- Beiträge: 6
- Registriert: 10.09.2012, 19:23
Ich verstehe nicht, warum ich mit Onlinetests, wo ich die "Ergebnisse" eintrage eine sehr hohe Signifikanz bekomme und bei SPSS, wo ich mit Rohdaten arbeite, plötzlich keine Signifikanz mehr habe - das wurmt mich.
Wobei ich jetzt einen Schritt weiter bin:
Bei den Online Sachen trage ich folgendes ein:
3-12
12-3
für
(Gruppe A, 3x Äußerung) - (Gruppe A, 12x keine Äußerung)
(Gruppe B,12x Äußerung) - (Gruppe B, 3x keine Äußerung)
SPSS macht aus meiner langen 0er und 1er Liste von oben allerdings
3-0
9-3
wodurch 12 und 3 zu den Randsummen werden und nicht zu den Zellenwerten.[/img]
Wobei ich jetzt einen Schritt weiter bin:
Bei den Online Sachen trage ich folgendes ein:
3-12
12-3
für
(Gruppe A, 3x Äußerung) - (Gruppe A, 12x keine Äußerung)
(Gruppe B,12x Äußerung) - (Gruppe B, 3x keine Äußerung)
SPSS macht aus meiner langen 0er und 1er Liste von oben allerdings
3-0
9-3
wodurch 12 und 3 zu den Randsummen werden und nicht zu den Zellenwerten.[/img]
-
Dems
- Beiträge: 6
- Registriert: 10.09.2012, 19:23
-
Generalist
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
eine kreuztabelle berechnet man aus 2 variablen. in einer der beiden
variablen steht die gruppenzugehörigkeit eines falles (hier a oder b, zu
codieren besispielsweise mit 1 und 2). in der anderen variable steht der
messwert des falles. dann berechnet sich die kreuztabelle aus gruppe x
messwertausprägung.
variablen steht die gruppenzugehörigkeit eines falles (hier a oder b, zu
codieren besispielsweise mit 1 und 2). in der anderen variable steht der
messwert des falles. dann berechnet sich die kreuztabelle aus gruppe x
messwertausprägung.
-
Dems
- Beiträge: 6
- Registriert: 10.09.2012, 19:23
Okay, damit komme ich meinem Problem etwas näher 
Ich habe das auch noch mal für die Suchmaschinen zusammengefasst, falls mal jemand vor einem ähnlichen Problem steht:
Anbei eine detaillierte Erklärung des Problems, wie SPSS arbeitet bzw. wie ich die Funktionsweise von SPSS verstehe, falls jemand mal vor dem selben Problem steht:
Nehmen wir an, es gibt zwei Gruppen, Gruppe X und Gruppe Y. Von Gruppe X sagen 3 Personen ja und 3 Personen nein, von Gruppe Y sagen 3 Personen ja und 3 Personen nein
Dabei steht 1 für JA und 0 für NEIN
GruppeX-GruppeY
1
1
1
0
0
0
Gruppe Y:
0
1
1
0
1
0
SPSS wertet diese Ergebnisse HORIZONTAL aus:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0
Daraus ergibt sich:
1x 1-0 => n=1
2x 1-1 => n=2
2x 0-1 => n=2
1x 0-1 => n=1
==> n gesamt = 6
-----
Ich hätte gerne gehabt, dass das Ganze VERTIKAL ausgewertet wird:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0
Gruppe X:
3x1 => n=3
3x0 => n=3
Gruppe Y:
3x1 => n=3
3x0 => n=3
n gesamt = 12
Ich habe das auch noch mal für die Suchmaschinen zusammengefasst, falls mal jemand vor einem ähnlichen Problem steht:
Anbei eine detaillierte Erklärung des Problems, wie SPSS arbeitet bzw. wie ich die Funktionsweise von SPSS verstehe, falls jemand mal vor dem selben Problem steht:
Nehmen wir an, es gibt zwei Gruppen, Gruppe X und Gruppe Y. Von Gruppe X sagen 3 Personen ja und 3 Personen nein, von Gruppe Y sagen 3 Personen ja und 3 Personen nein
Dabei steht 1 für JA und 0 für NEIN
GruppeX-GruppeY
1
1
1
0
0
0
Gruppe Y:
0
1
1
0
1
0
SPSS wertet diese Ergebnisse HORIZONTAL aus:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0
Daraus ergibt sich:
1x 1-0 => n=1
2x 1-1 => n=2
2x 0-1 => n=2
1x 0-1 => n=1
==> n gesamt = 6
-----
Ich hätte gerne gehabt, dass das Ganze VERTIKAL ausgewertet wird:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0
Gruppe X:
3x1 => n=3
3x0 => n=3
Gruppe Y:
3x1 => n=3
3x0 => n=3
n gesamt = 12
-
Dems
- Beiträge: 6
- Registriert: 10.09.2012, 19:23
Nach etwas Literatur-Wälzen habe ich auch verstanden, was du gemeint hast in deinem vorherigen Post.
Damit ist mein Problem gelöst
Das Ganze war, wie du richtig vermutet hast, ein Fehler bei der Dateneingabe in SPSS:
Ich hatte:
Variable 1: Ergebnisse Gruppe A
Variable 2: Ergebnisse Gruppe B
Stattdessen brauche ich
Variable 1:
untereinander, komplett die:
Ergebnisse Gruppe A
Ergebnisse Gruppe B
Variable 2:
untereinander:
Name Gruppe A
Name Gruppe B
Also sähe das im Bezug auf die allererste Tabelle so aus:
1-A
1-A
1-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-B
0-B
0-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
Damit bekomme ich auch das Ergebnis der Online-Tools und bin jetzt gerade sehr, sehr glücklich
Damit ist mein Problem gelöst
Das Ganze war, wie du richtig vermutet hast, ein Fehler bei der Dateneingabe in SPSS:
Ich hatte:
Variable 1: Ergebnisse Gruppe A
Variable 2: Ergebnisse Gruppe B
Stattdessen brauche ich
Variable 1:
untereinander, komplett die:
Ergebnisse Gruppe A
Ergebnisse Gruppe B
Variable 2:
untereinander:
Name Gruppe A
Name Gruppe B
Also sähe das im Bezug auf die allererste Tabelle so aus:
1-A
1-A
1-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-B
0-B
0-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
Damit bekomme ich auch das Ergebnis der Online-Tools und bin jetzt gerade sehr, sehr glücklich



