[Anfängerfrage] Signifikanz zweier nominalverteilter Gruppen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

[Anfängerfrage] Signifikanz zweier nominalverteilter Gruppen

Beitrag von Dems »

tl;dr: Warum unterscheidet sich das Ergebnis des exakten SPSS Fisher Tests von dem Fisher Test / Chi quadrat Tests, den man online machen kann?

Begrüßung und Experimentbeschreibung
Hallo allerseits,
ich bin ein Neuling im Gebiet Statistk / SPSS und habe ein Problem, bei dem ich mir unsicher bin, wo der Denkfehler ist.

Kommen wir zu einem Beispielexperiment:

Es werden zwei Gruppen untersucht, beide Gruppen umfassen jeweils 15 Personen.

Gruppe A hat einen Zeitungstext gelesen, der in der Schrift Times New Roman geschrieben ist.
Gruppe B hat einen Zeitungstext gelesen, der in der Schrift Comic Sans geschrieben ist.

Es wird untersucht, ob sich die Personen im anschließenden Interview zum Vorhandensein bzw. Nichtvorhandensein der Serifen äußern.

Daraus gibt sich folgende Nominalskalierung:

Variable 1 in SPSS, Gruppe A
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert

Variable 2 in SPSS, Gruppe B
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert

Dies wird mit 0 (nicht Äußerung) und 1 (Äußerung) codiert.

Datensatz
Daraus ergibt sich folgende Statistik:


A-B
1-0
1-0
1-0
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1ä

Daraus ergibt sich:
Gruppe A hat sich 3x geäußert und 12x nicht geäußert
Gruppe B hat sich 12x geäußert und 3x nicht geäußert


Unterschiede bei der Online-Auswertung und SPSS:

Gebe ich diese Ergebnisse (3-12, 12-3) auf einer der vielen Online-Plattformen ein, bekomme ich folgendes Ergebnis: p = 0.0028 (bei http://graphpad.com/quickcalcs/contingency2.cfm) oder p = 0.002814etc (bei http://vassarstats.net/tab2x2.html). Auch bei anderen Tests der Seite http://www.statpages.org/#CrossTabs komme ich auf das Ergebnis.

Bei SPSS hingegen bekomme ich mit den Rohdaten folgendes Ergebnis:
https://dl.dropbox.com/u/9584865/SPSS-Rohdaten.png

Und wenn ich die Ergebnisse eingebe:
https://dl.dropbox.com/u/9584865/SPSS-E ... ingabe.png

Problemlösung: Falsche Eingabe, n=2 laut Randwerten, danke, Generalist


=> bei beiden ist die Exakte Signifikanz (2 Seitig) nach Fisher = 1.0


Fragen

Dass das mit den Rohdaten schief geht, liegt daran, dass die Auswertung vom Chi Test nominalskaliert geschieht, oder?

Wie kommt dieser Unterschied zu Stande?

Gibt es zwischen 3 Äußerungen in Gruppe A und 12 Äußerungen in Gruppe B tatsächlich keinen signifikanten Unterschied?

Gibt es andere Methoden, mit denen ich eine Signifikanz der Ergebnisse / der Rohdaten nachweisen könnte? Oder bin ich mit Fisher / Chi Quadrat schon an der richtigen Adresse?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Du hast es bei SPSS falsch eingegeben. Laut Inhalt bzw. laut Randwerten
der Kreuztabelle hast Du n=2 beobachtete Fälle.
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

Beitrag von Dems »

Ok, habs korrigiert, danke!

Hat jemand noch Lösungshinweise für die Rohdaten?
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

Beitrag von Dems »

Ich verstehe nicht, warum ich mit Onlinetests, wo ich die "Ergebnisse" eintrage eine sehr hohe Signifikanz bekomme und bei SPSS, wo ich mit Rohdaten arbeite, plötzlich keine Signifikanz mehr habe - das wurmt mich.


Wobei ich jetzt einen Schritt weiter bin:

Bei den Online Sachen trage ich folgendes ein:
3-12
12-3

für
(Gruppe A, 3x Äußerung) - (Gruppe A, 12x keine Äußerung)
(Gruppe B,12x Äußerung) - (Gruppe B, 3x keine Äußerung)


SPSS macht aus meiner langen 0er und 1er Liste von oben allerdings
3-0
9-3

wodurch 12 und 3 zu den Randsummen werden und nicht zu den Zellenwerten.[/img]
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

Beitrag von Dems »

Um mit SPSS auf das zu kommen, was ich bei den Online-Seiten eingebe, müsste die Verteilung wie folgt sein:

3x 1 und 1
3x 0 und 0
12x 1 und 0
12x 0 und 1

1 1
1 1
1 1
0 0
0 0
0 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

eine kreuztabelle berechnet man aus 2 variablen. in einer der beiden
variablen steht die gruppenzugehörigkeit eines falles (hier a oder b, zu
codieren besispielsweise mit 1 und 2). in der anderen variable steht der
messwert des falles. dann berechnet sich die kreuztabelle aus gruppe x
messwertausprägung.
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

Beitrag von Dems »

Okay, damit komme ich meinem Problem etwas näher :)

Ich habe das auch noch mal für die Suchmaschinen zusammengefasst, falls mal jemand vor einem ähnlichen Problem steht:


Anbei eine detaillierte Erklärung des Problems, wie SPSS arbeitet bzw. wie ich die Funktionsweise von SPSS verstehe, falls jemand mal vor dem selben Problem steht:

Nehmen wir an, es gibt zwei Gruppen, Gruppe X und Gruppe Y. Von Gruppe X sagen 3 Personen ja und 3 Personen nein, von Gruppe Y sagen 3 Personen ja und 3 Personen nein
Dabei steht 1 für JA und 0 für NEIN

GruppeX-GruppeY
1
1
1
0
0
0

Gruppe Y:
0
1
1
0
1
0

SPSS wertet diese Ergebnisse HORIZONTAL aus:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0

Daraus ergibt sich:
1x 1-0 => n=1
2x 1-1 => n=2
2x 0-1 => n=2
1x 0-1 => n=1

==> n gesamt = 6

-----

Ich hätte gerne gehabt, dass das Ganze VERTIKAL ausgewertet wird:

Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0

Gruppe X:
3x1 => n=3
3x0 => n=3

Gruppe Y:
3x1 => n=3
3x0 => n=3

n gesamt = 12
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Das ist erneut völlig daneben. Es wäre wünschenswert, wenn Du Dich
einmal anhand einer enführenden Webseite, einem Buch oder einem online-
Tutorial mit den basalen Dingen wie der Datenstrukturierung in SPSS befasst.
Dems
Beiträge: 6
Registriert: 10.09.2012, 19:23

Beitrag von Dems »

Nach etwas Literatur-Wälzen habe ich auch verstanden, was du gemeint hast in deinem vorherigen Post.

Damit ist mein Problem gelöst :)

Das Ganze war, wie du richtig vermutet hast, ein Fehler bei der Dateneingabe in SPSS:

Ich hatte:
Variable 1: Ergebnisse Gruppe A
Variable 2: Ergebnisse Gruppe B

Stattdessen brauche ich

Variable 1:
untereinander, komplett die:
Ergebnisse Gruppe A
Ergebnisse Gruppe B


Variable 2:
untereinander:
Name Gruppe A
Name Gruppe B

Also sähe das im Bezug auf die allererste Tabelle so aus:

1-A
1-A
1-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-A
0-B
0-B
0-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B
1-B

Damit bekomme ich auch das Ergebnis der Online-Tools und bin jetzt gerade sehr, sehr glücklich ;)
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten